Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

dataset #3

Open
King-king424 opened this issue Jun 30, 2024 · 10 comments
Open

dataset #3

King-king424 opened this issue Jun 30, 2024 · 10 comments

Comments

@King-king424
Copy link

对于BTCV数据集,raw data中有training有83个nii.gz 文件, testing 有73个nii.gz文件,不知道是否正确?
image

@King-king424
Copy link
Author

还有预处理之后保存的png图片都是全黑的,这是正常的吗?

@lin-tianyu
Copy link
Owner

对于BTCV数据集,raw data中有training有83个nii.gz 文件, testing 有73个nii.gz文件,不知道是否正确? image

不是这些数据。
你需要先在synapse.org注册一个账号,然后加入这个challenge
这样就可以在“Files”栏目下看到“Abdomen”文件夹。
BTCV数据集请下载Abdomen/RawData.zip

@King-king424
Copy link
Author

对于BTCV数据集,raw data中有training有83个nii.gz 文件, testing 有73个nii.gz文件,不知道是否正确? image

不是这些数据。 你需要先在synapse.org注册一个账号,然后加入这个challenge。 这样就可以在“Files”栏目下看到“Abdomen”文件夹。 BTCV数据集请下载Abdomen/RawData.zip

那预处理之后保存的png图片都是全黑的,这是正常的吗?

@lin-tianyu
Copy link
Owner

是的,请仔细看代码。
png图片中的每个像素的值代表类别编号,最大也只有十几,视觉上当然是全黑的。

@JacksonWang
Copy link

你好, 我對你這個專案也很有興趣. 但我想拿來用在arcade 的心血管資料作訓練. 我目前是用yolo segment 的方式作業, 不知道如果要導入你的方案, 我該要如何開始?

@lin-tianyu
Copy link
Owner

@JacksonWang 谢谢你的兴趣,不过我没太理解你的情况。可以麻烦你详细说明一下“用yolo segment的方式作业”是什么意思吗?

@JacksonWang
Copy link

你好, 我目前是使用yolov9 作segment (SAM)方面的模型訓練, 但是出來的成果並不是那麼好, 我想把你的專案的程序導入我用yolov9 的方案裡, 先用你的方案訓練後的成果把arcade 圖像的資料確認, 再用yolov9 作目標偵測. 但我不知道我該要如何把arcade 資料集的格式(目前有json 及yolo 二種格式)轉換成你的專案格式, 不知道這部份可以有什麼方式可以作?

@lin-tianyu
Copy link
Owner

lin-tianyu commented Jul 23, 2024

@JacksonWang 你好,根据你提供的信息,我的理解如下:

  1. 你提到的arcade数据集是这个对吧:https://arcade.grand-challenge.org/ 我看了一下对应的论文,原论文提出一个“使用YOLOv8先进行目标检测区分出各段血管,再使用其segmentation head进行分割”的两阶段方案。
  2. 你是希望用YOLOv9来替换原论文方法中的v8,然后用我的模型(SDSeg)训练后生成的分割结果来训练YOLOv9,是这个意思对吗?
  3. 我不太清楚arcade数据集给出的标签转换成yolo格式后,是只有目标检测框(bbox)还是同时包括了像素级分割标签。(抱歉我对YOLO系列模型和arcade数据集不是非常熟悉:)

如果我的上述理解是正确的,那么:

  1. 如果数据集的yolo标签中包含了像素级分割标签,那么你需要编写脚本将其转换成jpg/png等图片格式进行储存(对应的心血管图像你可以自行编写torch.utils.dataDataset来读取,或者也转换成图片格式)。
    其中,背景像素的值为0,前景像素的值为1(而不是255)。
    图像和分割标签处理完成后在SDSeg项目中的储存位置可以在README中的“Dataset Settings”和“Important Files and Folders to Focus on”中找到。

PS:你或许可以参照本项目中所使用的CVC-ClinicDB数据集的相关代码来进行设置,因为这个数据集的图像和对应的分割标签也都是图片格式(*.tiff*.png格式)

  1. 如果数据集的标签中仅包含了bbox标签,那么SDSeg可能无能为力。

@JacksonWang
Copy link

非常感謝你, 在我這語意不清的情況下還能知道我需要的是什麼. 你說的1與2都對, 3的部份, 原資料集已經提供了json 格式且像素級分割標籤, 我自己也寫了其它程式, 轉成yolo 的格式(非bbox而己)再去作yolov9 segment 的訓練. 這部份已經有成功經驗了. 所以你文中提到的 "数据集的yolo标签中包含了像素级分割标签,那么你需要编写脚本将其转换成jpg/png等图片格式进行储存(对应的心血管图像你可以自行编写torch.utils.dataDataset来读取,或者也转换成图片格式)", 我理解成, 我可以從你的專案中, 參照你的作法, 去修改我的資料集, 再拿去作SDSeg的模型訓練. 我的理解對嗎?
再次感謝你的回覆及提示!

@lin-tianyu
Copy link
Owner

我可以從你的專案中, 參照你的作法, 去修改我的資料集, 再拿去作SDSeg的模型訓練. 我的理解對嗎?

是的,你的理解是对的👍 以我自己的经验来说,当我们想使用别人的代码库运行新的数据集时几乎都应该这么做:模仿代码库中处理数据集的方式来加入自己的数据集。(这样最不容易出现bug,修改起来成本也较低)

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants