————-새로운 예측 혁신으로 놀라울 정도로 현실에 가까운 결과 제공

리하이 대학교 통계학자 김태호가 이끄는 국제 수학자 그룹은 실제 결과와 더욱 밀접하게 일치하는 예측을 생성하는 새로운 방법을 개발했습니다. 그들의 방법은 과학의 여러 분야, 특히 건강 연구, 생물학 및 사회 과학 전반에 걸쳐 예측을 개선하는 것을 목표로 합니다.

연구원들은 그들의 기술을 최대 일치 선형 예측기(MALP)라고 부릅니다. 핵심 목표는 예측된 값이 관찰된 값과 얼마나 잘 일치하는지 향상하는 것입니다. MALP는 일치 상관 계수(CCC)를 최대화하여 이를 수행합니다. 이 통계 측정은 정밀도(점들이 얼마나 촘촘하게 클러스터되어 있는지)와 정확도(해당 선에 얼마나 가까운지)를 모두 반영하여 산점도에서 숫자 쌍이 45도 선을 따라 어떻게 떨어지는지 평가합니다. 널리 사용되는 최소 제곱법을 포함한 전통적인 접근 방식은 일반적으로 평균 오류를 줄이려고 노력합니다. 많은 상황에서 효과적이긴 하지만 이러한 방법은 주요 목표가 예측과 실제 값 사이의 강력한 일치를 보장하는 것인 경우 목표를 놓칠 수 있다고 수학과 조교수인 Kim은 말합니다.

“때때로 우리는 예측이 근접하기를 원하지 않고 실제 값과 가장 일치하기를 원합니다”라고 Kim은 설명합니다. “문제는 과학적으로 의미 있는 방식으로 두 개체의 일치를 어떻게 정의할 수 있느냐는 것입니다. 이것을 개념화할 수 있는 한 가지 방법은 예측 값과 실제 값 사이의 산점도에서 점이 45도 선에 얼마나 가깝게 정렬되어 있는지입니다. 따라서 이들의 산점도가 이 45도 선과 강한 정렬을 보인다면 이 둘 사이에 좋은 수준의 일치가 있다고 말할 수 있습니다.”

단순한 상관관계보다 합의가 더 중요한 이유

김 씨에 따르면 사람들은 일치라는 단어를 들으면 피어슨 상관계수를 가장 먼저 떠올리는 경우가 많다. 피어슨 상관계수는 통계 교육 초기에 소개되어 여전히 기본적인 도구이기 때문이다. Pearson의 방법은 두 변수 사이의 선형 관계의 강도를 측정하지만 관계가 45도 선과 일치하는지 여부를 구체적으로 확인하지는 않습니다. 예를 들어 데이터 포인트가 직선에 가깝다면 50도 또는 75도 기울어진 선에 대한 강한 상관관계를 감지할 수 있다고 Kim은 말합니다.

“우리의 경우 특히 45도 선과의 정렬에 관심이 있습니다. 이를 위해 우리는 Lin이 1989년에 도입한 일치 상관 계수라는 다른 측정값을 사용합니다. 이 측정 기준은 특히 데이터가 45도 선과 얼마나 잘 정렬되는지에 중점을 둡니다. 우리가 개발한 것은 예측 값과 실제 값 사이의 일치 상관 관계를 최대화하도록 설계된 예측기입니다.”

눈 스캔 및 신체 측정으로 MALP 테스트

MALP의 성능을 평가하기 위해 팀은 시뮬레이션 데이터와 눈 스캔 및 체지방 평가를 포함한 실제 측정값을 모두 사용하여 테스트를 실행했습니다. 한 연구에서는 두 가지 유형의 OCT(광간섭 단층촬영) 장치인 구형 Stratus OCT와 최신 Cirrus OCT를 비교하는 안과학 프로젝트의 데이터에 MALP를 적용했습니다. 의료 센터가 Cirrus 시스템으로 전환함에 따라 의사는 시간 경과에 따른 결과를 비교할 수 있도록 측정값을 변환하는 신뢰할 수 있는 방법이 필요합니다. 연구원들은 왼쪽 눈 26개와 오른쪽 눈 30개의 고품질 이미지를 사용하여 MALP가 Cirrus OCT 측정에서 Stratus OCT 판독값을 얼마나 정확하게 예측할 수 있는지 조사하고 그 성능을 최소 제곱법과 비교했습니다. MALP는 실제 Stratus 값과 더 밀접하게 일치하는 예측을 생성했으며, 최소 제곱은 평균 오류를 줄이는 데 있어 MALP보다 약간 더 나은 성능을 발휘하여 일치와 오류 최소화 사이의 균형을 강조했습니다.

연구팀은 또한 체중, 복부 크기 및 기타 신체 치수가 포함된 성인 252명의 체지방 데이터 세트를 조사했습니다. 수중 체중 측정과 같은 체지방 비율의 직접적인 측정은 신뢰할 수 있지만 비용이 많이 들기 때문에 더 쉬운 측정으로 대체되는 경우가 많습니다. MALP는 체지방 비율을 추정하는 데 사용되었으며 최소 제곱법에 대해 평가되었습니다. 결과는 눈 스캔 연구와 유사했습니다. MALP는 실제 값과 더 밀접하게 일치하는 예측을 제공한 반면 최소 제곱은 평균 오류가 약간 더 낮았습니다. 이러한 반복된 패턴은 합의와 오류 최소화 사이의 지속적인 균형을 강조했습니다.

올바른 작업에 적합한 도구 선택

Kim과 그의 동료들은 MALP가 표준 기술보다 실제 데이터와 더 효과적으로 일치하는 예측을 자주 제공한다는 것을 관찰했습니다. 그럼에도 불구하고 그들은 연구자들이 특정 우선순위에 따라 MALP와 보다 전통적인 방법 중에서 선택해야 한다고 지적합니다. 전반적인 오류를 줄이는 것이 주요 목표인 경우 확립된 방법은 여전히 ​​잘 수행됩니다. 실제 결과와 최대한 일치하는 예측이 강조되는 경우 MALP가 더 강력한 옵션인 경우가 많습니다.

이 연구의 잠재적 영향은 많은 과학 분야에 영향을 미칩니다. 향상된 예측 도구는 의학, 공중 보건, 경제 및 엔지니어링에 도움이 될 수 있습니다. 예측에 의존하는 연구자들에게 MALP는 유망한 대안을 제공합니다. 특히 예측 값과 관찰 값 사이의 평균 격차를 줄이는 것보다 실제 결과와 긴밀한 합의를 달성하는 것이 더 중요할 때 더욱 그렇습니다.

김씨는 “추가 조사가 필요하다”고 말했다. “현재 우리의 설정은 선형 예측기 클래스에 속합니다. 이 세트는 다양한 분야에서 실질적으로 사용할 수 있을 만큼 크지만 수학적으로 말하면 여전히 제한적입니다. 따라서 이를 일반 클래스로 확장하여 선형 부분을 제거하여 최대 일치 예측기가 되도록 하겠습니다.”

출처: https://www.sciencedaily.com/releases/2025/11/251112111023.htm

코멘트

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다