banner

소식

Nov 12, 2023

UnMICST: 인간 조직의 고도로 다중화된 이미지를 강력하게 분할하기 위한 실제 증강을 통한 딥 러닝

커뮤니케이션 생물학 5권, 기사 번호: 1263(2022) 이 기사 인용

2494 액세스

1 인용

7 알트메트릭

측정항목 세부정보

향후 기술을 통해 연구 및 진단을 위해 포유류 조직의 고도로 다중화된(20-60 채널) 세포하 해상도 이미지를 일상적으로 수집할 수 있습니다. 이러한 이미지에서 단일 세포 데이터를 추출하려면 딥 러닝에서 일반적으로 해결되는 어려운 문제인 정확한 이미지 분할이 필요합니다. 본 논문에서는 다양한 기계 학습 아키텍처를 사용하여 조직의 이미지 분할을 크게 개선하는 두 가지 결과를 보고합니다. 첫째, 훈련 데이터에 의도적으로 초점이 흐려지고 포화된 이미지를 포함하면 후속 이미지 분할이 크게 향상된다는 것을 예기치 않게 발견했습니다. 이러한 실제 증대는 계산적 증대(가우시안 블러링)보다 성능이 뛰어납니다. 또한 항체 칵테일을 사용하여 여러 조직의 핵 봉투를 이미지화하여 핵 윤곽선을 더 잘 식별하고 분할을 개선하는 것이 실용적이라는 것을 발견했습니다. 두 가지 접근법은 광범위한 조직 유형에 대한 분할을 누적적으로 실질적으로 개선합니다. 우리는 실제 증강의 사용이 현미경 외부의 이미지 처리에 응용될 것이라고 추측합니다.

조직과 종양을 구성하는 세포 유형, 기저막 및 결합 구조는 세포 소기관에서 전체 기관(<0.1 ~ >104μm)에 이르는 길이 규모로 존재합니다. 면역조직화학으로 보완된 헤마톡실린과 에오신(H&E)을 사용한 현미경 검사는 오랫동안 조직 구조 연구에서 주요한 역할을 해왔습니다2,3. 더욱이, 임상 조직병리학은 암과 같은 질병의 단계를 결정하고 임상적으로 관리하는 주요 수단으로 남아 있습니다4. 그러나 고전적 조직학은 세포 하위 유형을 정확하게 식별하고 발달 메커니즘을 연구하며 질병 유전자를 특성화하기에는 분자 정보가 충분하지 않습니다. 정상 및 질병 조직의 고플렉스 이미징(보충 표 1)5,6,7,8,9(때때로 공간 단백질체학이라고도 함)는 풍부한 20~60개 항원에 대한 세포내 분해능 데이터를 생성하며 이는 세포 유형을 식별하는 데 충분합니다. 세포 상태(정지, 증식, 죽어가는 등)를 측정하고 세포 신호 전달 경로를 조사합니다. 또한 High-plex 이미징은 보존된 3D 환경에서 조직 무결성에 필수적인 무세포 구조의 형태와 위치를 보여줍니다. 하이플렉스 이미징 방법은 해상도, 시야 및 다중성(플렉스)이 다르지만 모두 조직 섹션의 2D 이미지를 생성합니다. 현재 실제로는 두께가 5~10μm입니다.

다중화된 이미지가 분할되고 정량화되면 결과 단일 세포 데이터는 단일 세포 RNA 시퀀싱(scRNASeq) 데이터를 자연스럽게 보완하며, 이는 정상 세포와 질병 세포 및 조직에 대한 우리의 이해에 극적인 영향을 미쳤습니다10,11. 그러나 해리성 RNASeq과 달리 다중 조직 이미징은 형태와 공간 정보를 보존합니다. 그러나 하이플렉스 이미징 데이터는 현재까지 생물학 중심 머신 비전 시스템의 주요 강조점인 배양된 세포의 이미지보다 계산적으로 분석하기가 훨씬 더 어렵습니다. 특히, 영상 데이터의 단일 세포 분석에는 인스턴스 또는 픽셀 방식으로 이미지에 클래스 레이블을 할당하여 세분화하는 컴퓨터 비전 기술인 분할이 필요합니다. 그런 다음 생성된 분할 마스크는 마스크로 식별된 각 객체(셀) 또는 마스크의 윤곽을 그리거나 중심에 있는 모양(일반적으로 고리)에 걸쳐 형광 신호 강도를 통합하여 다양한 마커의 강도를 정량화하는 데 사용됩니다. 배양에서 성장한 후생동물 세포를 분할하는 방법 개발에 광범위한 작업이 진행되었지만 조직 이미지의 분할은 세포 밀집과 다양한 세포 유형의 다양한 형태로 인해 더 어려운 과제입니다. 최근에는 이미지 인식, 객체 감지 및 합성 이미지 생성에서 CNN(컨볼루션 신경망)이 널리 사용되는 것과 병행하여 기계 학습을 사용하는 분할 루틴이 표준이 되었습니다. ResNet, VGG16, 그리고 최근에는 UNet 및 Mask R-CNN14,15과 같은 아키텍처는 수백만 개의 매개변수를 학습하고 데이터 세트 전체에 걸쳐 일반화하는 능력으로 널리 수용되었습니다. 이는 다음과 같이 광범위한 세분화 경쟁에서 뛰어난 성능을 입증한 것입니다. 공개적으로 사용 가능한 이미지 데이터 세트17,18를 사용하는 해커톤 챌린지16에서도 마찬가지입니다.

공유하다