대부분의 과학 데이터는 새로운 발견을 이끌어낼 수 있는 잠재력을 최대한 발휘하지 못합니다.
생성된 100개의 데이터 세트 중 약 80개는 실험실에 남아 있고, 20개는 공유되지만 거의 재사용되지 않으며, 2개 미만이 FAIR 표준을 충족하고, 일반적으로 단 하나만이 새로운 결과로 이어집니다.
결과는 심각합니다. 암 치료의 진행 속도가 느려지고, 증거가 부족한 기후 모델, 재현할 수 없는 연구 등이 있습니다.
이를 바꾸기 위해 개방형 과학 출판사인 Frontiers는 세계 최초의 포괄적인 AI 기반 연구 데이터 서비스인 Frontiers FAIR² Data Management를 도입했습니다. 큐레이션, 규정 준수 확인, AI 지원 형식화, 동료 검토, 대화형 포털, 인증 및 영구 호스팅 등 모든 필수 단계를 하나의 원활한 프로세스로 결합하여 데이터를 재사용 가능하고 적절하게 적립할 수 있도록 설계되었습니다. 목표는 오늘날의 연구 투자가 건강, 지속 가능성 및 기술 분야의 더 빠른 발전으로 전환되도록 하는 것입니다.
FAIR²는 모든 데이터 세트가 AI와 호환되고 인간과 기계 모두에서 윤리적으로 재사용 가능함을 보장하는 확장된 개방형 프레임워크를 통해 FAIR 원칙(찾기 가능, 액세스 가능, 상호 운용 가능 및 재사용 가능)을 기반으로 구축되었습니다. FAIR² 데이터 관리 시스템은 이 모델의 첫 번째 실제 구현으로, 연구 성과가 빠르게 증가하고 인공 지능이 발견 방법을 재구성하는 순간에 도달했습니다. 이는 높은 수준의 원칙을 측정 가능한 영향을 미치는 실제 확장 가능한 인프라로 전환합니다.
Frontiers의 공동 창립자이자 CEO인 Kamila Markram 박사는 다음과 같이 설명합니다.
“과학의 90%가 공허 속으로 사라집니다. Frontiers FAIR² 데이터 관리를 사용하면 데이터 세트나 발견이 다시는 손실될 필요가 없습니다. 이제 모든 기여가 발전을 촉진하고 그에 합당한 공로를 인정받으며 과학을 활성화할 수 있습니다.”
핵심에 있는 AI
한때 수개월에 걸쳐 수동 작업이 필요했던 작업(데이터세트 구성 및 확인부터 메타데이터 및 게시 가능한 출력 생성까지)은 이제 FAIR²를 뒷받침하는 Frontiers 벤처인 Senscience가 지원하는 AI Data Steward에 의해 몇 분 만에 완료됩니다.
데이터를 제출한 연구원은 인증된 데이터 패키지, 동료 검토 및 인용 가능한 데이터 기사, 시각화 및 AI 채팅 기능을 갖춘 대화형 데이터 포털, FAIR² 인증서 등 4가지 통합 출력을 받습니다. 각 요소에는 품질 관리와 명확한 요약이 포함되어 있어 일반 사용자가 데이터를 더 쉽게 이해할 수 있고 연구 분야 간 호환성이 높아집니다.
이러한 결과를 통해 모든 데이터 세트가 보존, 검증, 인용 및 재사용 가능하게 되므로 연구자에게 적절한 인식을 제공하는 동시에 발견을 가속화하는 데 도움이 됩니다. Frontiers FAIR²는 또한 가시성과 접근성을 향상시켜 과학자, 정책 입안자, 실무자, 커뮤니티, 심지어 AI 시스템까지 책임 있는 재사용을 지원함으로써 사회가 과학에 대한 투자에서 더 큰 가치를 추출할 수 있도록 합니다.
플래그십 파일럿 데이터세트
-
SARS-CoV-2 변종 속성 — 3,800개의 스파이크 단백질 변이체를 다루는 이 데이터 세트는 AlphaFold2 및 ESMFold의 구조적 예측을 ACE2 결합 및 발현 데이터와 연결합니다. 이는 전염병 대비를 위한 강력한 리소스를 제공하여 변형 행동과 적합성에 대한 더 깊은 이해를 가능하게 합니다.
-
전임상 뇌손상 MRI — 4개 연구 센터의 343개 확산 MRI 스캔으로 구성된 조화로운 데이터 세트는 프로토콜 전반에 걸쳐 표준화되고 비교 가능하도록 조정되었습니다. 재현 가능한 바이오마커 발견, 강력한 교차 사이트 분석 및 전임상 외상성 뇌 손상 연구의 발전을 지원합니다.
-
환경 압력 지표(1990-2050) — 60년 동안 43개국에서 관찰된 데이터와 모델링된 예측을 결합한 이 데이터 세트는 배출량, 폐기물, 인구 및 GDP를 추적합니다. 이는 지속 가능성 벤치마킹과 증거 기반 기후 정책 계획을 뒷받침합니다.
-
인도 태평양 환초 생물다양성 — 5개 지역에 걸쳐 280개 환초에 걸쳐 있는 이 데이터 세트는 생물 다양성 기록, 암초 서식지, 기후 지표 및 인간 사용 이력을 통합합니다. 이는 취약한 섬 생태계에 대한 생태 모델링, 보존 우선 순위 지정 및 지역 간 연구를 위한 전례 없는 기반을 제공합니다.
파일럿을 테스트한 연구원들은 Frontiers FAIR²가 데이터를 보존하고 공유할 뿐만 아니라 품질 검사, 비전문가를 위한 명확한 요약, 여러 분야에 걸쳐 데이터 세트를 결합하는 신뢰성을 통해 과학자들이 인정을 받을 수 있도록 보장함으로써 데이터 재사용에 대한 확신을 구축한다고 언급했습니다.
모든 파일럿 데이터 세트는 FAIR² 개방형 사양을 준수하여 장기적으로 인간과 기계 사용을 위해 책임감 있게 선별되고 재사용 가능하며 신뢰할 수 있으므로 오늘날의 데이터는 사회의 가장 시급한 과제에 대한 내일의 솔루션을 가속화할 수 있습니다.
인식 및 재사용
재사용할 때마다 원본 데이터 세트의 가치가 배가되어 발견이 낭비되지 않고 모든 기여가 다음 혁신을 촉발할 수 있으며 연구자는 자신의 작업에 대한 인정을 받을 수 있습니다.
FAIR² 데이터 관리를 뒷받침하는 최첨단 AI 벤처인 Senscience의 공동 창립자이자 CEO인 Sean Hill 박사는 다음과 같이 말합니다.
“과학은 데이터를 생성하는 데 수십억 달러를 투자하지만 그 중 대부분은 손실되며 연구자들은 거의 인정을 받지 못합니다. Frontiers FAIR²를 통해 모든 데이터 세트가 인용되고 모든 과학자가 인정받으며 마침내 데이터 생성의 필수 작업에 보상을 받습니다. 이것이 치료법, 기후 솔루션 및 신기술이 사회에 더 빨리 도달할 수 있는 방법입니다. 이것이 우리가 과학을 활성화하는 방법입니다.”
연구자들이 말하는 것
Ángel Borja 박사, AZTI, 해양 연구, 바스크 연구 및 기술 연합(BRTA) 수석 연구원:
“이런 종류의 데이터 큐레이션과 기사 게시를 적극 권장합니다. 정보를 매우 빠르게 생성할 수 있고 모든 최종 사용자에게 유용한 형식이 되기 때문입니다.”
Erik Schultes, Leiden Academic Center for Drug Research(LACDR) 선임 연구원; FAIR 구현 책임자, GO FAIR 재단:
“Frontiers FAIR²는 프로젝트의 과학적 측면을 완벽하게 포착했습니다.”
Femke Heddema, 연구원 겸 건강 데이터 시스템 혁신 관리자, PharmAccess:
“Frontiers FAIR²는 연구원과 디지털 건강 구현자가 FAIR 원칙을 보다 원활하게 실행할 수 있도록 하여 MomCare와 같은 데이터 세트를 재사용 가능하게 만드는 것이 복잡할 필요가 없음을 입증합니다. 투명하고 접근 가능하며 실행 가능한 데이터를 활성화함으로써 Frontiers FAIR²는 건강 연구에서 새로운 기회의 문을 엽니다.”
Neil Harris 박사, 캘리포니아 대학교 로스앤젤레스(UCLA) 뇌 손상 연구 센터 신경외과 상주 교수:
“(Frontiers) FAIR²의 구현은 다양한 수준에서 유용한 데이터 누락 및 품질에 대한 객관적인 검사를 제공할 수 있습니다. 이러한 유형의 편견 없는 평가 및 데이터 요약은 비분야 전문가의 이해를 돕고 궁극적으로 데이터 공유를 향상시킬 수 있습니다. 해당 분야가 보다 이질적인 하위 분야에서 빅 데이터를 사용하는 방향으로 발전함에 따라 이러한 데이터 검사 및 요약은 우리가 이미 사용하고 결합할 수 있는 방법을 잘 파악하는 데 중요해질 것입니다. 현재 분석 내에서 데이터를 수집했습니다.”
Maryann Martone, Open Data Commons의 편집장:
“(Frontiers) FAIR²는 데이터를 FAIR로 만드는 가장 쉽고 효과적인 방법 중 하나입니다. 모든 PI는 연구실, 공동 작업자 및 과학 커뮤니티 전반에서 데이터를 찾고, 액세스하고, 비교하고, 재사용할 수 있기를 원합니다. 실제 병목 현상은 항상 필요한 시간과 노력이었습니다. (Frontiers) FAIR²는 이러한 장벽을 극적으로 낮추어 대부분의 실험실에서 진정한 FAIR 데이터를 사용할 수 있게 해줍니다.”
Vincent Woon Kok Sin 박사, 조교수, 탄소 중립 및 기후 변화 추력, 홍콩 과학기술대학교(HKUST) Society Hub:
“(Frontiers) FAIR²는 우리의 글로벌 폐기물 데이터세트를 더욱 가시적이고 접근 가능하게 만들어 종종 부족하고 단편적인 데이터로 어려움을 겪는 전 세계 연구자들을 돕습니다. 이를 통해 협업이 확대되고 지속 가능한 폐기물 관리에 대한 통찰력이 가속화되기를 바랍니다.”
Sebastian Steibl 박사, Naturalis Biodiversity Center 및 오클랜드 대학교 박사후 연구원:
“진정한 데이터 접근성은 단지 데이터시트를 저장소에 업로드하는 것 이상입니다. 이는 수년간의 교육 없이도 데이터를 쉽게 보고, 탐색하고, 이해할 수 있게 만드는 것을 의미합니다. AI 챗봇과 대화형 시각적 데이터 탐색 및 요약 도구를 갖춘 (Frontiers) FAIR² 플랫폼을 통해 우리의 생물 다양성 및 환경 데이터를 학자뿐만 아니라 실무자, 정책 입안자, 지역 사회 이니셔티브까지 광범위하게 접근하고 사용할 수 있습니다.”
출처: https://www.sciencedaily.com/releases/2025/10/251013040314.htm

답글 남기기