3d2017全年開獎號,DSB2017第一名論文理解: 3D Deep Leaky Noisy-or Network(二)

 2023-10-06 阅读 25 评论 0

摘要:ps:主要是看了之后過幾天就是不是特別清晰了,故大概能看懂的感興趣的地方記錄下。 代碼論文等基礎信息在上一篇。 三.數據和預處理 A.數據 訓練本模型用了兩個肺掃描數據集:肺結節分析數據集簡稱LUNA,數據科學碗2017訓練集簡稱DSB。LUNA:這個數據

ps:主要是看了之后過幾天就是不是特別清晰了,故大概能看懂的感興趣的地方記錄下。

代碼論文等基礎信息在上一篇。

三.數據和預處理

A.數據

訓練本模型用了兩個肺掃描數據集:肺結節分析數據集簡稱LUNA,數據科學碗2017訓練集簡稱DSB。LUNA:這個數據集上有888個病人,1186個標記的肺結節。?DSB:這個數據集上1397個病人作為訓練,198個病人作為驗證,506個病人作為測試。其中值得我們注意的是DSB只是告訴你這個病人通過這次掃描是否被診斷為患有肺癌。作者人工標記了訓練集中的754個結節和驗證集中的78個結節(不標記訓練時候幫不上忙啊)。

3d2017全年開獎號、兩個數據集存在很大的不同。首先luna16標注了很多直徑很小的結節,這些結節一般是無關與癌癥。根據醫生的經驗,直徑小于6mm的結節是不危險的。而DSB數據集中有許多非常大的結節(超過40mm)。DSB的平均結節直徑在13.68mm,而luna16的平均直徑在8.31mm。另外DSB中有很多結節與主支氣管相連,這是LUNA16中很少見的。因此如果直接只利用LUNA16作為訓練數據,在DSB上的檢測效果會不好。大結節的缺失會造成不正確的癌癥預測,因為存在大的肺結節是癌癥病人的一大特點。為此,作者去掉了LUNA中所有6mm以下的人工標記注釋,同時手動標記了在DSB數據集上。

由于作者沒有肺結節診斷的專業知識,所以之前結節的選擇和手動標注可能會提高相當大的噪聲(誤差)。所以在模型的下一步(癌癥分類診斷)設計用于對錯誤檢測進行穩健,這可以減輕了對高度可靠的結節標簽的需求。

B.預處理

所有預處理的步驟過程如圖3所示。所有數據先轉換成HU值,HU是用來描述放射強度的一個標準定量分數。每個組織都有它特定的HU值范圍,如同不同的人種一樣。

1) Mask extraction(掩碼提取):一張CT圖像不僅擁有肺,同時還擁有其他組織。這些組織中有一些是很像結節的球形的組織。為了排除這些干擾項,最方便的方法是提取肺部的掩碼同時忽視其它組織在檢測階段。對于每個切片(一個ct中的一張圖像),2d圖像先用高斯濾波器(標準差為1)濾波,同時把-600作為閾值二值化圖像。所有連通區域小于30mm^2的區域以及曲率超過0.99的區域(對應于一些高亮度徑向成像噪聲?)舍去。這樣把所有2d圖像遍歷操作一遍遍可以計算獲得3d二值矩陣,接著僅保留那些整個肺不接觸矩陣邊角的同時體積在0.68 L 到7.5 L之間的。

bact/alert 3d、完成上面這步之后通常只會留下一個整肺(二值化后一個整肺組織),但有時候還有其它組織剩下來。對比其它組織這個肺部組織一般占據著圖像的中心。我們計算在所有切片上該組織距離圖像中心的最小距離(MinDist))和它的面積。接著保留組織面積大于6000mm^2的切片,計算這些切片的平均MinDist。如果這個平均MinDist值大于62mm ,則這個組件被移除。剩下的組件合并便組成了肺部掩碼。

在一些情況下,肺在頂部切片上連接到外部世界,這使得上述過程不能將肺與外部世界空間分開。 因此,需要首先移除這些切片以使上述處理工作。

2) Convex hull & dilation(凸包&擴張):有些結節會連接到肺的外壁上面,它們沒有在上一步得到的掩碼包含。為了能讓肺部掩碼中包含它們,一個方便的方法就是計算之前得到掩碼的凸包。然而直接計算面罩的凸包將包括太多不相關的組織(比如心臟和脊柱),所以這個肺的掩碼首先分離成兩個部分(大致對應于左肺和右肺),接著如下方法計算各自的凸包。

掩模被迭代侵蝕,直到它被分成兩個組件(它們的體積相似),從左右兩個肺的中心開始。然后將這兩個組件擴張回原始尺寸。如圖3(d)左右肺分離后畫出的掩碼圖。對于每個掩模,大多數2D切片用其凸包替換以包括上面提到的那些結節如圖3(e)。得到的掩碼外擴10個像素點。聯合兩肺掩碼便得到了最終的掩碼(如圖3f)。

福彩3d圖謎總匯 今天、當然,一些2D低層切片中的肺呈現新月形狀如圖4.,它們的凸包包含的不是我們想要的肺部組織。如果凸包后的該組織掩碼面積是凸包前的1.5倍及以上的話,僅保留原始掩碼如圖4e。

3) Intensity normalization(強度歸一化):為了把數據送入深度網路,我們圖像的HU值轉為UNIT8.從原始數據中裁剪出[-1200,600],然后線性轉化到[0,255].然后將其乘以上面獲得的完整掩模,并且掩模外的所有東西都填充170,這是普通組織的亮度。另外,對于前一次擴張所產生的空間步驟,所有大于210的值也替換為170(第二次擴充了10個像素點)。因為周圍區域包含一些骨骼(高亮度組織),它們很容易錯誤分類為鈣化結節(也是高亮度組織)。我們選擇用170填充骨骼,使它們看起來像正常組織(圖3g)。 在所有3個維度中裁剪圖像,使每邊的邊距為10像素(圖3h)。

?

我翻譯的速度好慢啊。吐槽下,加油。下面是更加細節的東西。

版权声明:本站所有资料均为网友推荐收集整理而来,仅供学习和研究交流使用。

原文链接:https://hbdhgg.com/2/123090.html

发表评论:

本站为非赢利网站,部分文章来源或改编自互联网及其他公众平台,主要目的在于分享信息,版权归原作者所有,内容仅供读者参考,如有侵权请联系我们删除!

Copyright © 2022 匯編語言學習筆記 Inc. 保留所有权利。

底部版权信息