Controllable Text-to-Image Synthesis for Multi-Modality MR Images

Kim, Kyuri; Na, Yoonho; Ye, Sung-Joon; Lee, Jimin; Ahn, Sung Soo; Park, Ji Eun; Kim, Hwiyoung

doi:10.1109/WACV57701.2024.00775

YUHSpace

BROWSE

0 573

Cited 0 times in

Controllable Text-to-Image Synthesis for Multi-Modality MR Images

DC Field	Value	Language
dc.contributor.author	Kim, Kyuri	-
dc.contributor.author	Na, Yoonho	-
dc.contributor.author	Ye, Sung-Joon	-
dc.contributor.author	Lee, Jimin	-
dc.contributor.author	Ahn, Sung Soo	-
dc.contributor.author	Park, Ji Eun	-
dc.contributor.author	Kim, Hwiyoung	-
dc.date.accessioned	2025-07-09T08:34:37Z	-
dc.date.available	2025-07-09T08:34:37Z	-
dc.date.created	2025-03-31	-
dc.date.issued	2024-04	-
dc.identifier.issn	2472-6737	-
dc.identifier.uri	https://ir.ymlib.yonsei.ac.kr/handle/22282913/206491	-
dc.description.abstract	Generative modeling has seen significant advancements in recent years, especially in the realm of text-to-image synthesis. Despite this progress, the medical field has yet to fully leverage the capabilities of large-scale foundational models for synthetic data generation. This paper introduces a framework for text-conditional magnetic resonance (MR) imaging generation, addressing the complexities associated with multi-modality considerations. The framework comprises a pre-trained large language model, a diffusionbased prompt-conditional image generation architecture, and an additional denoising network for input structural binary masks. Experimental results demonstrate that the proposed framework is capable of generating realistic, highresolution, and high-fidelity multi-modal MR images that align with medical language text prompts. Further, the study interprets the cross-attention maps of the generated results based on text-conditional statements. The contributions of this research lay a robust foundation for future studies in text-conditional medical image generation and hold significant promise for accelerating advancements in medical imaging research.	-
dc.description.statementOfResponsibility	restriction	-
dc.language	영어	-
dc.publisher	IEEE COMPUTER SOC	-
dc.relation.isPartOf	2024 IEEE/CVF WINTER CONFERENCE ON APPLICATIONS OF COMPUTER VISION, WACV 2024	-
dc.rights	CC BY-NC-ND 2.0 KR	-
dc.title	Controllable Text-to-Image Synthesis for Multi-Modality MR Images	-
dc.type	Article	-
dc.contributor.college	College of Medicine (의과대학)	-
dc.contributor.department	Dept. of Neurosurgery (신경외과학교실)	-
dc.contributor.googleauthor	Kim, Kyuri	-
dc.contributor.googleauthor	Na, Yoonho	-
dc.contributor.googleauthor	Ye, Sung-Joon	-
dc.contributor.googleauthor	Lee, Jimin	-
dc.contributor.googleauthor	Ahn, Sung Soo	-
dc.contributor.googleauthor	Park, Ji Eun	-
dc.contributor.googleauthor	Kim, Hwiyoung	-
dc.identifier.doi	10.1109/WACV57701.2024.00775	-
dc.subject.keyword	Algorithms	-
dc.subject.keyword	Applications	-
dc.subject.keyword	Biomedical / healthcare / medicine	-
dc.subject.keyword	Vision + language and/or other modalities	-
dc.contributor.alternativeName	Kim, Hwiyoung	-
dc.contributor.affiliatedAuthor	Ahn, Sung Soo	-
dc.contributor.affiliatedAuthor	Kim, Hwiyoung	-
dc.identifier.scopusid	2-s2.0-85192026462	-
dc.identifier.wosid	001222964608008	-
dc.citation.startPage	7921	-
dc.citation.endPage	7930	-
dc.identifier.bibliographicCitation	2024 IEEE/CVF WINTER CONFERENCE ON APPLICATIONS OF COMPUTER VISION, WACV 2024 : 7921-7930, 2024-04	-
dc.identifier.rimsid	86311	-
dc.type.rims	ART	-
dc.description.journalClass	1	-
dc.description.journalClass	1	-
dc.subject.keywordAuthor	Algorithms	-
dc.subject.keywordAuthor	Applications	-
dc.subject.keywordAuthor	Biomedical / healthcare / medicine	-
dc.subject.keywordAuthor	Vision + language and/or other modalities	-
dc.type.docType	Proceedings Paper	-
dc.description.isOpenAccess	N	-
dc.description.journalRegisteredClass	scopus	-
dc.relation.journalWebOfScienceCategory	Computer Science, Artificial Intelligence	-
dc.relation.journalWebOfScienceCategory	Computer Science, Interdisciplinary Applications	-
dc.relation.journalWebOfScienceCategory	Engineering, Electrical & Electronic	-
dc.relation.journalWebOfScienceCategory	Imaging Science & Photographic Technology	-
dc.relation.journalResearchArea	Computer Science	-
dc.relation.journalResearchArea	Engineering	-
dc.relation.journalResearchArea	Imaging Science & Photographic Technology	-

Appears in Collections:: 1. College of Medicine (의과대학) > Dept. of Radiology (영상의학교실) > 1. Journal Papers
1. College of Medicine (의과대학) > Dept. of Neurosurgery (신경외과학교실) > 1. Journal Papers

Show simple item record Find it @ YMLIB

License

YUHSpace: Controllable Text-to-Image Synthesis for Multi-Modality MR Images

YUHSpace

BROWSE

Browse

Links