'젊은바카라사이트 벳무브공학자(YoungRobotEngineer)'코너는한국바카라사이트 벳무브학회와바카라사이트 벳무브신문이공동으로기획한시리즈물로미래한국바카라사이트 벳무브산업을이끌어갈젊은바카라사이트 벳무브공학자를발굴해소개하는데있다.
74번째인터뷰는한국과학기술연구원(KIST)김수민박사다.김박사는1988년생으로2013년KAIST컴퓨터사이언스학사,2015년석사,2021년2월박사학위를받았다.졸업후2021년4월부터현재까지KISTAI·로봇연구소인공지능연구단에서재직하고있으며,2024년3월선임연구원으로승진하였다.
2020년KAIST전기및전자공학부EECSRisingStarsinKorea상을수상했으며,2022년GISTInstituteofIntegratedTechnologySeminar,2023KOREATECHAISeminar등에서초청강연을하였다.
주요연구분야는컴퓨터비전(장면/이미지이해,바카라사이트 벳무브비전),비전랭귀지모델(VLM),이미지프로세싱/복원등이다.

Q.KIST인공지능연구단에대해간략한소개부탁드립니다.
KIST인공지능연구단은한국과학기술연구원(KIST)AI·로봇연구소내에위치해있으며인공지능기술을다양한분야에적용하여국가사회적문제를해결하는연구를포함하여다양한인공지능전반연구를진행중입니다.이는디지털휴먼,3D공간인식,로봇의3차원물체인지등을포함하며인공지능응용기술인과학치안등을포함하고있습니다.
Q.최근하고계신연구가있다면소개부탁드립니다.
저는현재사족보행바카라사이트 벳무브이촬영한이미지를활용하여,비전랭귀지모델(VLM:Vision-LanguageModel)을기반으로바카라사이트 벳무브주변환경을인식하고그상황을분석하는연구를진행하고있습니다.

이연구의목표는멀티이미지데이터를활용해하나의VLM이바카라사이트 벳무브의환경을정확히인지하고,그곳에서벌어지는상황을이해할수있도록하는것입니다.이를통해사용자가바카라사이트 벳무브에게질문을하면,바카라사이트 벳무브이인식한환경에대해적절한답변을제공할수있는프레임워크를구축하는것또한목표라고할수있습니다.

이기술은다양한응용분야에활용될수있지만,우선적으로자율주행동행로봇연구에적용될예정입니다.특히,노약자나여성의안전한귀가를돕는시스템에활용될가능성이높습니다.
Q.2021년2월KAIST에서“ImageRestorationandEnhancementwithPhysically-basedCues”로박사학위를받으셨는데어떤내용인지소개부탁드립니다.
제가박사학위를받은연구는이미지복원및향상기술에대한연구들로고전적인단일이미지기반방법부터학습기반의이미지프로세싱연구까지포함하고있습니다.학위논문은크게두가지연구로나눌수있습니다.

하나는이미지인페인팅연구로,사용자가지정한이미지내특정영역을자동으로채우는문제입니다.이미지내물체의색이란해당물체의고유한반사율(reflectance)과쉐이딩(shading)의곱으로나타낼수있으며빛에의한효과를제외한고유반사율을추정해물체의본래색상을기반으로인페인팅하는방식을제안했습니다.이를통해잘못된패치를가져오는문제를방지하고,조명이나그림자로인한색변화가존재하는경우에도사용자가지정한부분의빈공간을자연스럽게메꾸어줄수있는결과를얻었습니다.

또다른하나는GAN(GeneratvieAdversarialNetwork)기반유리반사제거연구입니다.유리반사제거네트워크학습을위하여유리반사가포함된이미지와그렇지않은실제이미지쌍이대량으로필요하지만실제로이러한데이터는존재하지않는다는점에착안한연구입니다.이를해결하기위하여기존이미지데이터에서이미지의깊이정보(depth)를추정하고이를기반으로메쉬화하여물리기반렌더링을통하여카메라렌즈와유리반사효과를시뮬레이션한유리반사학습데이터셋을생성했습니다.이연구에서물리적으로타당한방식으로대규모데이터셋을만들었으며이를최대한활용할수있는네트워크구조를제안하여유리반사제거성능을크게향상시켰습니다.

Q.박사님의주요관심분야가컴퓨터비전(장면/이미지이해,로봇비전),비전랭귀지모델(VLM),이미지프로세싱/복원등으로알고있다.컴퓨터비전이나VLM분야의최신동향이나기술적인트렌드가있다면무엇인지궁금합니다.
컴퓨터비전과VLM(Vision-LanguageModel)분야는최근몇년동안급격한발전을이루고있습니다.특히멀티모달학습을이용한네트워크들이큰변화를주도하고있습니다.멀티모달학습중가장큰부분은텍스트와이미지를함께학습하는것인데오픈AI의클립,플라밍고와같은모델들이그대표적예이며이들은이미지의시각적정보와텍스트의의미정보를연결할수있는능력을보여주고있습니다.이와같은멀티모달네트워크는대규모언어모델(LLM)과결합되어,텍스트와시각정보를동시에학습하고상호작용을이해하는VLM의기반이되었습니다.이러한VLM들은자연어와융합되어이미지를이해하는것뿐아니라,자연어를통해이미지를설명하고,이미지와관련된질문에대답할수있게되었습니다.
로봇비전또한VLM의또다른중요한응용분야인것같습니다.컴퓨터비전과VLM을활용해로봇이실시간으로환경을인식하고,상황을분석하는기술이연구되고있습니다.특히,멀티뷰이미지나3D공간인식기술을활용하여로봇이복잡한환경에서도정확하게위치를파악하고,다양한객체를인식할수있는기술들이주목받고있습니다.이러한기술은자율주행차,드론,그리고로봇공학분야에서광범위하게사용되고있고현재저는이방향으로연구를진행중입니다.
Q.박사학위취득후2021년4월부터현재까지KISTAI·로봇연구소인공지능연구단에서연구원,선임연구원으로계셨는데어떤연구를하셨는지궁금합니다.
저는크게두가지연구를진행하였었는데요,뉴럴휴먼생성연구와언어계층정보를접목한장면이해연구입니다.

첫번째로뉴럴휴먼의경우하나의물체를촬영한다시점이미지들을이용하여하나의3D모델자체를다층신경망(MLP:Multi-LayerPerceptron)에저장하는차세대영상합성분야기술인NeRF(NeuralRadianceFields)기반디지털휴먼연구입니다.이는기존의클래시컬한메쉬(mesh)기반모델링보다더욱실존인물과유사하기에어색함이덜하고특히NeRF기반네트워크를이용한함축적(implicit)모델링은화소수에상관없이결과를뽑아낼수있어많이활용되고있습니다.저는이러한뉴럴휴먼을광선굴곡법(raybending)을활용하여움직이게만드는연구를진행하였었습니다.

두번째로,언어계층정보를접목한장면이해연구의경우는사람의인지방식을모사고자한연구입니다.인간은사전에학습된언어카테고리를바탕으로장면을인지하며,이러한어휘체계는본질적으로계층구조를가지고있습니다.

예를들어,멀리서보았을때의자나책상과같은개별객체들이하나의'가구'라는범주로인식되는것처럼,장면을다양한수준에서이해하게됩니다.이연구는멀티레벨세그멘테이션데이터생성방법을개발하여,사람이상황에따라동일한물체를다른레벨로인식하는과정을모사했습니다.구체적으로는,장면별단어트리를생성해객체를다양한수준에서이해할수있도록했으며,또한해당연구는장면트리를형성시에동음이의어를제대로처리하기위하여이미지패치와클립을활용한방법을제안하였습니다.
Q.컴퓨터사이언스를연구하면서가장어려운점은무엇입니까?
아무래도너무빠르게기술들이발전되고또트렌드가변화하는것이어려운점중하나인것같습니다.인공지능(AI)분야에서는특히나새로운알고리즘,모델,그리고하드웨어가빠르게등장하고있습니다.이러한변화속에서연구자는최신기술과트렌드를지속적으로따라가며,새로운도구나이론을빠르게익혀야하는데그를위한많은시간과노력이필요한것같습니다.
또한대규모데이터와자원의필요성도어려운점중하나인것같습니다.AI기술들은방대한양의데이터를필요로하고,이를학습하기위한고성능컴퓨팅자원이필수적입니다.연구자들은이러한대규모자원확보에어려움을겪는경우가많으며,때로는자원이제한된상황에서도최선의결과를끌어내야하게되는데이러한부분또한풀어내야하는숙제라고생각됩니다.
Q.컴퓨터사이언스를연구하게된동기가있다면?
저는학부물리학과와전산학을복수전공하였는데,졸업연구를물리학과광학연구실에서적혈구의이미지를분석하여해당적혈구가말라리아에걸린것인지,걸렸다면어느정도진행이된것인지에추론하는연구를진행하였습니다.이를계기로영상기반의인식및처리에대한깊은흥미가생겼고,이를바탕으로석사/박사를전산학(CS)로진학하게되었습니다.이후컴퓨터비전/영상처리쪽연구주제로학위를받게되었습니다.
Q.연구자로서앞으로의꿈과목표가있다면?
제연구는흔히말하듯컴퓨터에‘눈’을달아주는역할을한다고생각합니다.따라서저는조금더사람과비슷하게사고하고인식하는컴퓨터의‘눈’을만드는연구를해보고싶습니다.또한이러한연구들이논문으로발표되거나,연구실에서만머무는것이아니라실제환경에서실질적으로활용되고또나아가널리쓰이는기술이되게하는것이목표입니다.
연구자자체로써의목표는앞으로도끊임없이배우면서배움을게을리하지않으며AI와컴퓨터비전뿐만아니라로보틱스,생명과학등다양한학문과의융합을통해새로운가능성을탐구하고싶습니다.
Q.컴퓨터사이언티스트가되려는후배들에게어떤준비와노력이필요한지조언해주신다면?
크게두가지측면의준비와노력이필요하다고생각합니다.첫번째는컴퓨터사이언스의기본지식을확실히이해하고,이를필요할때바로적용할수있을정도로탄탄히다지는것입니다.두번째는급격히발전하는기술들을빠르게파악하고,짧은시간안에이를익혀실제로활용할수있는능력을기르는것입니다.
최근딥러닝을포함한다양한기술들이빠르게발전하고있으며,오픈소스를통해쉽게접할수있는시대가되었습니다.많은학생들이이를활용해보지만,정작그기술들이어떻게작동하는지에대한이론적인부분은소홀히하는경우가많습니다.하지만무엇인가새로운것을만들어내고발전시키려면기존기술이나구조의한계와문제를명확히이해하고,이를개선하기위한다양한기반지식이필요합니다.따라서기초적인이론과지식습득을소홀히하지말고,깊이있게공부하는것이매우중요하다고생각합니다.

Q.국내인공지능산업이한단계더발전하기위한방안이있다면...
인공지능산업이한단계더발전하기위하여다양한방안이존재할수이지만크게는두가지로말해볼수있을것같습니다.첫째는AI기술과인프라를확립하여글로벌기술의존도를줄이고,국내기술력을독립적으로발전시키는것이필요하다고생각합니다.현재글로벌기업들의투자와기술개발속도는매우빠르며,그들과의격차가존재하는것이사실입니다.그러나국내에서도공격적인투자와기술개발이이루어지지않으면,국내상황및환경에맞춘독자적인AI기술개발에는한계가있을것이라생각합니다.이를위해정부와민간이함께장기적인전략을세우고,AI연구개발에대한인프라와지원을지속적으로확대할필요가있다고생각합니다.
둘째는국내실정에맞는학습데이터의구축과관리입니다.인공지능의성능은양질의데이터에크게의존하므로,국내환경에특화된학습데이터를효율적으로생성하고관리하는것이중요하다생각합니다.다양한산업에서발생하는데이터를활용하여국내AI모델이더욱정확하고실용적으로발전할수있도록할수있게하는것이필요하다생각합니다.

Q.연구에주로영향을받은교수님이나연구자가계시다면...
석박사지도교수님이신KAIST윤성의교수님께아무래도제일많은영향을받은것같습니다.처음컴퓨터그래픽스로연구를시작하여컴퓨터비전으로연구방향을확장시켜나간것도,또컴퓨터비전연구가로보틱스와접목되어여러방향의흥미로운연구로이어지게된것도교수님의방향성에영향을받은것같습니다.교수님께서는특히학문간의융합과실제적인문제해결에대한연구를강조하셨습니다.교수님께배운유연적사고와도전정신은저의연구과정전반에걸쳐큰영감을주었고,앞으로도연구자로의태도에도영향을줄것같습니다.