ºñÀü°øÀÚµµ ÀÌÇØÇÒ ¼ö Àִ êGPT
Àΰ£À» ´É°¡ÇÏ´Â GPT-4
ÃÊ°Å´ë ¸ðµ¨, Å©±â ÀüÀïÀ» ½ÃÀÛÇÏ´Ù
óÀ½ ¿ÀÇÂAI¿¡¼ GPT ¸ðµ¨À» ¸¸µé ¶§¸¸ ÇØµµ ¸Å°³º¯¼ö´Â 1¾ï¿© °³¿¡ ºÒ°úÇß½À´Ï´Ù. ¹°·Ð À̰͵µ ´ç½Ã¿¡´Â ²Ï Å« Å©±â¿´ÁÒ. ±×·¯´ø °ÍÀÌ GPT-2¿¡ À̸£·¯¼´Â 10¹è ÀÌ»ó ´Ã¾î³ª 15¾ï °³°¡ µÆ½À´Ï´Ù. À̵ëÇØ GPT-3¿¡¼´Â ´õ¿í ³î¶ó¿î ÀÏÀÌ ¹ú¾îÁý´Ï´Ù. ¹«·Á 100¹è ÀÌ»ó Áõ°¡ÇÑ 1,750¾ï °³ÀÇ ¸Å°³º¯¼ö¸¦ °¡Áø ¸ðµ¨À» ¸¸µé¾î³½ °ÍÀÔ´Ï´Ù. Àΰ£ µÎ³úÀÇ ´º·±(½Å°æ ¼¼Æ÷) °³¼ö¸¦ 860¾ï °³·Î ÃßÁ¤Çϰí Àִµ¥, À̺¸´Ù ÈξÀ ´õ Å« ¸ðµ¨À» ¸¸µé¾î³½ °ÍÀÌÁÒ. ´ç½Ã¿¡´Â Àΰ£ÀÇ µÎ³úº¸´Ù ÈξÀ ´õ Å« ¸ðµ¨·Î ¾Ë·ÁÁö±âµµ Çß½À´Ï´Ù. ¹°·Ð ¸Å°³º¯¼ö°¡ ´º·±º¸´Ù ¸¹´Ù°í ÇØ¼ Àΰ£º¸´Ù ´õ ¶Ù¾î³ª´Ù°í º¼ ¼ö´Â ¾ø½À´Ï´Ù. ȤÀÚµéÀº ´º·±°ú ´º·±À» ÀÕ´Â ½Ã³À½ºÀÇ °³¼ö°¡ À̺¸´Ù ÈξÀ ´õ ¸¹Àº 320Á¶ °³¿¡ ´ÞÇϱ⠶§¹®¿¡, ¸Å°³º¯¼ö°¡ 320Á¶ °³´Â ³Ñ¾î¾ß Àΰ£°ú ºñ½ÁÇÑ ¼º´ÉÀ» ¹ßÈÖÇÒ ¼ö ÀÖ´Ù°í ÁÖÀåÇϱ⵵ ÇÕ´Ï´Ù. ¸¸¾à ±×·¸´Ù¸é ¾ÆÁ÷ °¥ ±æÀÌ ¸ÖÁÒ.
¾î·µç GPT-3´Â ³î¶ó¿î °á°ú¸¦ º¸¿©Áá½À´Ï´Ù. ÀÌÈÄ¿¡´Â À̸¦ ±â¹ÝÀ¸·Î ¿ì¸®°¡ Àß ¾Æ´Â êGPT°¡ µîÀåÇØ ¼¼»óÀ» ±ô¦ ³î¶ó°Ô Çß°í, ±× À̵ëÇØ¿¡´Â ´õ¿í ¾÷±×·¹À̵åµÈ GPT-4°¡ °ø°³µÆ½À´Ï´Ù. GPT-4 ÀÇ ¸Å°³º¯¼ö´Â ºñ°ø½ÄÀûÀ¸·Î´Â GPT-3º¸´Ù 10¹è ´õ Å« 1Á¶ 8,000¾ï °³·Î ÃßÁ¤Çϰí ÀÖÁÒ. ÀÌ·¸µí ¸Å°³º¯¼ö°¡ Á¡Á¡ Ä¿Áö¸é¼ ¸ðµ¨ÀÇ ¼º´ÉÀº ´õ¿í °·ÂÇØÁö°í ÀÖ½À´Ï´Ù. ÀÌÁ¦´Â ´Ü¼øÈ÷ Å©´Ù°í ºÎ¸£±â¿¡µµ ºÎÁ·ÇÒ ¸¸Å ¾öû³ ±Ô¸ð°¡ µÆÁÒ. ±×·¡¼ LLMÀÇ Large¸¦ ¡®´ë±Ô¸ð¡¯ ¶Ç´Â ¡®ÃʰŴ롯¶ó ºÎ¸£´Â °ÍÀÔ´Ï´Ù.
GPTÀÇ ÇнÀ ¹æ½ÄÀº ¾öû³ª°Ô ¸¹Àº ¹®ÀåÀ» ºÐ¼®ÇÏ¸é¼ ÀÚµ¿À¸·Î ÀÌ·ïÁý´Ï´Ù. ¼ö¸¹Àº ¹®Àå ¼Ó¿¡¼ ¾î¶² ´Ü¾î°¡ ´ÙÀ½¿¡ ³ª¿ÃÁö¸¦ ½º½º·Î ÇнÀÇÏ´Â °ÅÁÒ, ¿©±â¼ ÇÙ½ÉÀº ¹®ÀåÀ» ÇнÀÇÏ´Â µ¥ »ç¶÷ÀÇ µµ¿òÀÌ ÇÊ¿äÇÏÁö ¾Ê´Ù´Â Á¡ÀÔ´Ï´Ù.
ÀÌÀü¿¡µµ ¾ð¾î ¸ðµ¨Àº Åë°èÀû ¹æ¹ý µîÀ» ÅëÇØ ²ÙÁØÈ÷ ¹ßÀüÇØ¿ÔÁö¸¸, ´ëºÎºÐ ƯÁ¤ ÀÛ¾÷¿¡ ÃÖÀûÈµÈ µ¥ÀÌÅͰ¡ ¹Ýµå½Ã ÇÊ¿äÇß½À´Ï´Ù. À̸¦ Áöµµ ÇнÀ(Supervised Learning)À̶ó°í Çϴµ¥, À̸¦ À§Çؼ´Â ÇнÀ µ¥ÀÌÅ͸¦ ±¸ÃàÇØ¾ß Çß½À´Ï´Ù. ±×¸®°í »ç¶÷ÀÇ µµ¿òÀÌ ÇʼöÀûÀ̾ú½À´Ï´Ù. ¿¹¸¦ µé¾î ±àÁ¤ ¶Ç´Â ºÎÁ¤À» ÆÇ´ÜÇÏ´Â ºÐ·ù ÀÛ¾÷À» ÇнÀÇÒ ¶§ ¡°ÀÌ À½½ÄÀº ¸ÀÀÖ¾î.¡±¶ó´Â ¹®Àå¿¡´Â ¡®±àÁ¤¡¯, ¡°ÀÌ ¿µÈ´Â ³Ê¹« Àç¹Ì¾ø³×.¡±¶ó´Â ¹®Àå¿¡´Â ¡®ºÎÁ¤¡¯°ú °°Àº ½ÄÀ¸·Î »ç¶÷ÀÌ ÀÏÀÏÀÌ ÆÇº°ÇÏ¿© Á¤´äÀ» ´Þ¾Æ Áà¾ß ÇßÁÒ. ÀÌ °úÁ¤À» ¶óº§¸µ(Labeling)À̶ó°í ºÎ¸¨´Ï´Ù. ¹Ýµå½Ã »ç¶÷ÀÇ µµ¿òÀÌ ÇÊ¿äÇÏÁö¸¸, ¹Ýº¹ÀûÀ̰í Áö·çÇÑ ÀÛ¾÷ÀÌ¾î¼ Á»Ã³·³ ±¸ÃàÇϱⰡ ½±Áö ¾ÊÀº ÀÏÀ̱⵵ ÇÕ´Ï´Ù. ¿µ¾î±Ç¿¡¼´Â ÀΰǺñ°¡ ºñ½Ñ ¹Ì±¹À̳ª À¯·´ ´ë½Å Àεµ³ª ¾ÆÇÁ¸®Ä«ÀÇ ÀηÂÀ» Ȱ¿ëÇÏ´Â °æ¿ì°¡ ¸¹½À´Ï´Ù. êGPT ¶ÇÇÑ ÀϺΠ¶óº§¸µ µ¥ÀÌÅͰ¡ ÇÊ¿äÇß°í, À̸¦ À§ÇØ ¹«·Á 10°³¿ù ÀÌ»ó ÄɳĿ¡ ¿ÜÁÖ¸¦ ¸Ã°å´Ù°í ¹àÈù ¹Ù ÀÖ½À´Ï´Ù. Áß¿äÇÑ °ÍÀº ¸ðµç ÀÛ¾÷À» »ç¶÷ÀÌ ÀÏÀÏÀÌ ÇØ¾ß ÇÑ´Ù´Â Á¡ÀÌÁÒ. ¹®ÀåÀ» ¾Æ¹«¸® ¸¹ÀÌ ¸ðÀ¸°í ½Í¾îµµ Àοø°ú ÅõÀÔ ½Ã°£¿¡ ºñ·ÊÇÒ ¼ö¹Û¿¡ ¾ø±â ¶§¹®¿¡ ÀûÀÝÀº ½Ã°£°ú ³ë·ÂÀÌ ÇÊ¿äÇÕ´Ï´Ù. °Ô´Ù°¡ »ç¶÷ÀÌ ÇÏ´Â ÀÏÀÌ´Ù º¸´Ï ½Ç¼ö³ª À߸øµÈ °æ¿ìµµ ¸¹¾Æ¼ µ¥ÀÌÅÍÀÇ Ç°ÁúÀÌ ¶³¾îÁö¸é ±×¸¸Å ¸ðµ¨ÀÇ ¼º´Éµµ ÀúÇ쵃 ¼ö¹Û¿¡ ¾ø½À´Ï´Ù.
±×·¯³ª GPTÀÇ µîÀå ÀÌÈÄ, ´ë±Ô¸ð ºñÁöµµ ÇнÀ(Unsupervised Learning)ÀÌ ´Ù¾çÇÑ ÀÚ¿¬¾î ó¸® ÀÛ¾÷¿¡¼ ³ôÀº ¼º´ÉÀ» ¹ßÈÖÇÒ ¼ö ÀÖ´Ù´Â Á¡ÀÌ ÀÔÁõµÇ¾úÁÒ, ±×·¯¸é¼ ºñÁöµµ ÇнÀ ±â¹ÝÀÇ »çÀü ÇнÀÀÌ »õ·Î¿î Ç¥ÁØÀ¸·Î ÀÚ¸® Àâ½À´Ï´Ù. ÀÌÁ¦ ´õ ÀÌ»ó ¡®±àÁ¤¡¯ ¶Ç´Â ¡®ºÎÁ¤¡¯°ú °°Àº ¶óº§¸µµÈ µ¥ÀÌÅͰ¡ ÇÊ¿äÇÏÁö ¾Ê½À´Ï´Ù. ´ÜÁö ¼ö¸¹Àº ¹®ÀåÀ» ÇнÀÇϱ⸸ ÇÏ¸é µÇÁÒ. »ç¶÷ÀÇ °³ÀÔ ¾øÀ̵µ ¹æ´ëÇÑ ¹®ÀåÀ» ¸ð¾Æ ±×´ë·Î ÇнÀÇÒ ¼ö ÀÖ½À´Ï´Ù. ¼ö¹é¸¸ ±ÇÀÇ Ã¥¿¡¼, ¼öõ¸¸ °ÇÀÇ À̸ÞÀÏ¿¡¼, °¢Á¾ Ä¿¹Â´ÏƼÀÇ °Ô½Ã±Û¿¡¼, ¼¼»ó¿¡ Á¸ÀçÇÏ´Â ´Ù¾çÇÑ À¥»çÀÌÆ®¿¡¼ °¡´ÉÇÑ ÇÑ ¸¹Àº ¹®ÀåÀ» ¼öÁýÇØ »ç¶÷ÀÌ ÀüÇô ¼Õ´î ÇÊ¿ä ¾øÀÌ ±×´ë·Î ÇнÀÇÏ¸é µË´Ï´Ù. ÀÌ Á¡Àº Áö±ÝÀÇ LLMÀ» ź»ý½ÃŲ °¡Àå Å« Çõ½Å Áß ÇϳªÀÔ´Ï´Ù.
°ú¿¬ GPT-4ÀÇ ºñ¹ÐÀº?
´çȲ½º·´°Ôµµ ¿ÀÇÂAI´Â GPT-4¿Í °ü·ÃÇÑ ±â¼ú¿¡ ´ëÇØ ¾Æ¹«°Íµµ °ø°³ÇÏÁö ¾Ê±â·Î °áÁ¤ÇÕ´Ï´Ù. Åë»óÀûÀ¸·Î ÇÔ²² ¹ßÇ¥ÇÏ´ø ¿¬±¸ ³í¹®µµ °ø°³ÇÏÁö ¾Ê¾ÒÁÒ. ´ÜÁö ¡®±â¼ú º¸°í¼¡¯¶ó´Â À̸§À¸·Î GPT-4°¡ ¾ó¸¶³ª ¶Ù¾î³ ¾ð¾î ¸ðµ¨ÀÎÁö¸¦ ÀÚ¶ûÇÏ°í ¼Ò°³ÇÏ´Â ³»¿ë¸¸ °ø°³Çß½À´Ï´Ù. ±â¼ú º¸°í¼´Â »ó¼¼ÇÑ µ¿ÀÛ ¿ø¸®¸¦ ±â¼úÇÑ ³í¹®°ú´Â ¿ÏÀüÈ÷ ´Ù¸¨´Ï´Ù. ¸Å°³º¯¼ö°¡ ¸î °³ÀÎÁö, ¾î¶² ±â¼úÀ» »ç¿ëÇØ ¾î¶² ¹æ½ÄÀ¸·Î ÇнÀÇß´ÂÁö, ¸ðµ¨Àº ¾î¶² ±¸Á¶·Î µÇ¾î ÀÖ´ÂÁö ÀÌ ¸ðµç °ÍÀ» ºñ¹Ð¿¡ ºÎÃÆÁÒ. ¿ÀÇÂAI´Â GPT-4¿¡ ´ëÇØ ¾Æ¹«°Íµµ °ø°³ÇÏÁö ¾Ê¾Ò½À´Ï´Ù.
MoE¶ó´Â ¾àÀÚ·Î ´õ ÀÚÁÖ ¾²ÀÌ´Â Àü¹®°¡ È¥ÇÕ(Mixture of Experts) ¹æ½ÄÀº ¿©·¯ °³ÀÇ ¸ðµ¨À» ¸¸µé¾îµÎ°í ÇÊ¿äÇÑ ¸ðµ¨¸¸ ¼±ÅÃÇÏ¿© °è»êÇÏ´Â ±¸Á¶¸¦ ¸»ÇÕ´Ï´Ù. ¿¹¸¦ µé¾î Çϳª´Â ¼öÇÐ, Çϳª´Â ±¹¾î, Çϳª´Â ¿µ¾î, Çϳª´Â °úÇÐ ÀÌ·± ½ÄÀ¸·Î °¢°¢ÀÇ ¸ðµ¨À» ÇнÀÇß´Ù°í °¡Á¤Çغ¸ÁÒ. À̶§ ÇÁ·ÒÇÁÆ®°¡ ¼öÇÐ °ü·ÃÀ̶ó¸é ¼öÇÐ ¸ðµ¨·Î ¿¬°áÇϰí, °úÇÐ °ü·ÃÀ̶ó¸é °úÇÐ ¸ðµ¨·Î ¿¬°áÇÑ´Ù¸é ÈξÀ ´õ È¿À²ÀûÀ¸·Î °è»êÇÒ »Ó ¾Æ´Ï¶ó ´õ ³ªÀº °á°ú¸¦ ¾òÀ» ¼ö ÀÖ°ÚÁÒ? ±»ÀÌ ¿µ¾î Àü¹®°¡¿¡°Ô ¼öÇÐ ¹®Á¦¸¦ ¹°¾îº¼ ÇÊ¿ä´Â ¾ø½À´Ï´Ù. ¼öÇÐ ¹®Á¦´Â ¼öÇÐ Àü¹®°¡°¡ °¡Àå Àß ´ë´äÇÒ Å״ϱî¿ä. ¿ø·¡ LLMÀº ¸ðµ¨ Àüü°¡ °è»ê¿¡ ¸ðµÎ ÅõÀԵǴ ±¸Á¶Àε¥, MoE´Â ÀÌó·³ ÇÊ¿äÇÑ Àü¹®°¡ ¸ðµ¨¸¸ ¼±º°ÀûÀ¸·Î °è»ê¿¡ ÅõÀÔÇÏ¿© ºÒÇÊ¿äÇÑ °è»êÀ» ÁÙÀÏ ¼ö ÀÖÀ» »Ó ¾Æ´Ï¶ó, ´õ Á¤È®ÇÑ ´äº¯À» ¾òÀ» ¼ö ÀÖ½À´Ï´Ù.
¾î·µç Á¶Áö È£Ã÷´Â GPT-4°¡ ÀÌ·± MoE ±¸Á¶¸¦ »ç¿ëÇÑ´Ù°í ¸»Çß½À´Ï´Ù. 220B Àü¹®°¡ ¸ðµ¨ 8°³·Î ±¸¼ºµÆ´Ù´Â °ÅÁÒ. 2024³â º½¿¡ ¿¸° GTC 2024¿¡¼ ¿£ºñµð¾ÆÀÇ Á¨½¼ ȲÀÌ LLMÀ» ¼Ò°³Çß½À´Ï´Ù. ±×´Â GPT-4´Â 1.8T ¸ðµ¨À̶ó°í ¾ð±ÞÇÏ¸ç ºñ°ø½ÄÀûÀ¸·Î ÀÌ »ç½ÇÀ» È®ÀÎÇØ Áֱ⵵ Çß½À´Ï´Ù. 220B ¸ðµ¨ 8°³´Â ÃÑ 1.76TÀ̰í, À̸¦ ¹Ý¿Ã¸²Çϸé 1.8T°¡ µÇÁÒ. 1Á¶ 8,000¾ï °³¶ó´Ï ¾öû³ ¼ýÀÚÀÌÁö¸¸ ¿©ÀüÈ÷ Àΰ£ µÎ³ú ½Ã³À½ºÀÇ °³¼öÀÎ 320Á¶ °³¿¡´Â ÇÑÂü ¸ø ¹ÌÄ¡´Â ¼öÄ¡À̱ä ÇÕ´Ï´Ù.
À̿ܿ¡ ´Ù¸¥ Á¤º¸´Â ¿©ÀüÈ÷ ¾Ë ¼ö ¾ø½À´Ï´Ù. ¿ÀÇÂAI°¡ GPT-4¿¡ ´ëÇÑ ¼¼ºÎ Á¤º¸¸¦ °ø°³ÇÏÁö ¾Ê±â ¶§¹®ÀÌÁÒ ¿Ö ¿ÀÇÂAI´Â »ç¸íÀÎ ¡®¿ÀÇ¡¯°ú ´Þ¸® °©Àڱ⠱â¼úÀ» °ø°³ÇÏÁö ¾Ê°Ô µÆÀ»±î¿ä? ÀÏ·Ð ¸Ó½ºÅ©¿Í ¼Ò¼ÛÀ» ÁøÇàÇÏ¸é¼ °ø°³µÈ ¿ÀÇÂAIÀÇ ³»ºÎ ¹®°Ç¿¡ µû¸£¸é, ±â¼úÀÌ ¾î´À Á¤µµ ¼º¼÷µµ¿¡ À̸£¸é ´õ ÀÌ»ó ±â¼úÀ» °ø°³ÇÏÁö ¾Ê°í ºñ°ø°³·Î ÁøÇàÇϱâ·Î ³íÀÇÇßÀ½ÀÌ ³ª¿Í ÀÖ½À´Ï´Ù. Àΰ£À» ¶Ù¾î³ÑÀ» ¼ö ÀÖ´Â Àΰø Áö´É ±â¼úÀÌ ¹«ºÐº°ÇÏ°Ô °ø°³µÉ °æ¿ì ¿ÀÈ÷·Á Àηù¿¡°Ô ´õ À§ÇèÇÒ ¼ö Àֱ⠶§¹®¿¡ ¾ÈÀüÇϰí Ã¥ÀÓ°¨ ÀÖ°Ô ±â¼úÀ» ¹èÆ÷Çϱâ À§Çؼ¶ó´Â °Ô ºñ°ø°³ÇÏ´Â ÀÌÀ¯ÀÔ´Ï´Ù. ¸¶Ä¡ ÇÙÀ» ´Ù·ê ¶§¿Í ºñ½ÁÇÑ °üÁ¡À¸·Î Á¢±ÙÇß½À´Ï´Ù. ÇÙÀº ¸Å¿ì À¯¿ëÇÏÁö¸¸ ¹Ý¸é ¸Å¿ì À§ÇèÇϱ⠶§¹®¿¡ öÀúÈ÷ ÅëÁ¦µÇ°í, ÀÌ ±â¼ú¿¡ ´ëÇØ ¾Æ´Â »ç¶÷Àº Àü ¼¼°è¿¡ ±Ø¼Ò¼ö¿¡ ºÒ°úÇÏÁÒ. ¿ÀÇÂAI´Â GPT¿¡ ´ëÇØ¼µµ ºñ½ÁÇÑ °üÁ¡À¸·Î Á¢±ÙÇÕ´Ï´Ù. ¹°·Ð À̴ ǥ¸éÀûÀÎ ÀÌÀ¯¿¡ ºÒ°úÇÏ´Ù´Â ÁöÀûµµ ÀÖ½À´Ï´Ù. À§ÇèÇØ¼ °ø°³ÇÏÁö ¾Ê´Â °Ô ¾Æ´Ï¶ó ÀÚ»çÀÇ ÀÌÀÍÀ» ±Ø´ëÈÇϱâ À§ÇØ ´õ ÀÌ»ó °ø°³ÇÏÁö ¾Ê´Â´Ù´Â °ÅÁÒ.
À̿ܿ¡µµ GPT-4ÀÇ ±â¼ú ºñ°ø°³´Â Å©°Ô µÎ °¡Áö Àǹ̸¦ Áö´Õ´Ï´Ù.
ù°, ÀÌÁ¦ ¾ð¾î ¸ðµ¨Àº ¿¬±¸ ´Ü°è¸¦ ³Ñ¾î Á¦Ç°È ´Ü°è¿¡ µ¹ÀÔÇß´Ù°í º¼ ¼ö ÀÖ½À´Ï´Ù. ½ÇÁ¦·Î ¿ÀÇÂAI´Â ±â¾÷¿¡ êGPT¸¦ À¯·á·Î ¼ºñ½ºÇϰí ÀÖ½À´Ï´Ù. ¸¶ÀÌÅ©·Î¼ÒÇÁÆ®ÀÇ ºù(Bing)¿¡ µµÀÔµÈ °Íó·³ ¿©·¯ ȸ»çÀÇ ¼ºñ½º¿¡ À¯·á·Î API¸¦ °ø±ÞÇÏ¸ç º»°ÝÀûÀ¸·Î Ç÷§Æû ºñÁî´Ï½º¸¦ ÁøÇàÇÏ´Â Á¦Ç°È ´Ü°è¿¡ µ¹ÀÔÇßÁÒ. ±×·¡¼ ±â¼úÀ» °ø°³Çϱ⺸´Ù´Â Á¦Ç°ÀÇ ¿Ï¼ºµµ¸¦ ³ôÀÌ´Â ¹æÇâÀ» ÅÃÇß´Ù°í º¼ ¼ö ÀÖ½À´Ï´Ù.
µÑ°, ¿¬±¸ ¼º°ú·Î °ø°³ÇÒ ³»¿ëÀÌ ¸¹Áö ¾ÊÀ» ¼öµµ ÀÖ½À´Ï´Ù. Á¦3Àå¿¡¼ ÀÚ¼¼È÷ ¼³¸íÇϰÚÁö¸¸, RLHF¶ó´Â »õ·Î¿î ±â¼úÀ» »ç¿ëÇÒ ¶§¸¸ ÇØµµ °ü·Ã ³»¿ëÀÌ ³í¹®¿¡ »ó¼¼È÷ Àß ³ª¿Í ÀÖ¾ú½À´Ï´Ù. ÇÏÁö¸¸ êGPTºÎÅÍ´Â ³í¹®À» ¹ßÇ¥ÇÏÁö ¾Ê°í ÀÖ½À´Ï´Ù. ½ÇÁ¦·Î êGPTÀÇ ¼º´ÉÀÌ ¿ùµîÈ÷ Çâ»óµÇ±ä ÇßÁö¸¸, ÀÌ´Â »õ·Î¿î ¿¬±¸¸¦ µµÀÔÇߴٱ⺸´Ù´Â ±âÁ¸ ¸ðµ¨À» ´õ¿í ´Ùµë°í °íµµÈÇÑ °á°ú¿´ÁÒ. ±Ù°£ÀÌ µÇ´Â ±â¼úÀÌ ±âÁ¸°ú Å©°Ô ´Ù¸£Áö ¾Ê´Ù´Â °Ì´Ï´Ù. êGPT°¡ ±×·¨´ø °Íó·³ GPT-4¿¡¼µµ ÈξÀ ´õ ¼¼½ÉÇÏ°Ô Á¤Á¦µÈ µ¥ÀÌÅ͸¦ Ȱ¿ëÇØ ¸ðµ¨À» °³¼±Çß°í, ¾ÈÀü ¸ðµâ ¶ÇÇÑ ÃªGPTº¸´Ù ÈξÀ ´õ °ÈÇß½À´Ï´Ù. ÇÏÁö¸¸ ³í¹®À¸·Î ³²±æ Á¤µµÀÇ »õ·Î¿î ¿¬±¸¸¦ Çϱ⺸´Ù´Â ±âÁ¸ ±â¼úÀ» Á¦Ç°ÈÇÏ¸é¼ ´õ¿í Á¤±³ÇÏ°Ô ´ÙµëÀº °á°ú°¡ ¹Ù·Î GPT-4¶ó´Â °ÍÀÌÁÒ.
êGPT¸¦ ¿Ï¼ºÇÑ ºñ¹Ð ·¹½ÃÇÇ
RLHF, êGPT¸¦ ¿Ï¼ºÇÏ´Â ºñ¹Ð ·¹½ÃÇÇ
¿ÀÇÂAI´Â ÇÁ·ÒÇÁÆ®¸¦ Á» ´õ Àß µû¸£´Â ¸ðµ¨À» ¸¸µé±â À§ÇÑ ¿¬±¸¸¦ Áö¼ÓÇß½À´Ï´Ù. ¸¶Ä¡ »ç¶÷°ú ´ëÈÇÏµí ¹¶¶×±×·Á Áú¹®Çصµ »ç¿ëÀÚ ÇÁ·ÒÇÁÆ®¸¦ Âû¶±°°ÀÌ ¾Ë¾Æµè°í »ç¶÷ÀÌ ÀǵµÇÑ ´ë·Î ´ë´äÇÏ´Â ¸ðµ¨ ¸»ÀÌÁÒ. ¸¶Ä§³» À̵éÀº ¹Ì¼¼ Á¶Á¤(Fine Tuning)À̶ó´Â ±â¼úÀ» Àû¿ëÇØº¾´Ï´Ù. ¹Ì¼¼ Á¶Á¤À̶õ »çÀü ÇнÀµÈ ¸ðµ¨À» ƯÁ¤ ÀÛ¾÷À̳ª µµ¸ÞÀο¡ ¸Â°Ô Ãß°¡·Î ÇнÀ½ÃŰ´Â °úÁ¤À» ¸»ÇÕ´Ï´Ù. °¡Àå ¼º°øÀûÀÎ »ç·Ê°¡ ¹Ù·Î êGPTÀÔ´Ï´Ù. êGPT´Â ¾î¶°ÇÑ Áú¹®À̵ç Âû¶±°°ÀÌ ´ë´äÇÏÁÒ.
¸ÕÀú 1´Ü°è´Â µ¥ÀÌÅͼÂÀ» ±¸ÃàÇϰí Áöµµ ¹Ì¼¼ Á¶Á¤(Supervised Fine-Tuning) ¸ðµ¨À» ÇнÀÇÕ´Ï´Ù. ÀÌ·¸°Ô ¸¸µç ¸ðµ¨À» Áöµµ ¹Ì¼¼ Á¶Á¤ÀÇ ¾àÀÚ¸¦ µû SFT ¸ðµ¨À̶ó°í ºÎ¸¨´Ï´Ù. Àΰ£ÀÌ ÁöµµÇÑ ³»¿ë(Supervised)À¸·Î ¹Ì¼¼ÇÏ°Ô Á¶Á¤ÇÑ ¸ðµ¨À̶ó´Â ¶æÀÔ´Ï´Ù. ƯÁ¤ ÀÛ¾÷À̳ª µµ¸ÞÀο¡ ¸Â°Ô ¸ðµ¨À» Á¶Á¤ÇÏ´Â ÀÛ¾÷ÀÌÁÒ. Áï, ±âÁ¸ »çÀü ÇнÀ ¸ðµ¨¿¡ Àΰ£ÀÌ ¼¼½ÉÇÏ°Ô Á¤Á¦ÇÑ µ¥ÀÌÅ͸¦ ³Ö°í ´õ ´Ùµë¾ú´Ù´Â ¾ê±âÀÔ´Ï´Ù.
ÀÌ·¸°Ô ¸¸µç SFT ¸ðµ¨¿¡ ¿ÀÇÂAI´Â °ÈÇнÀ(Reinforcement Learning)À» µµÀÔÇÕ´Ï´Ù. °ÈÇнÀÀº ±â°è°¡ ½º½º·Î ÇнÀÇÏ¸ç ¼º´ÉÀ» Çâ»ó½ÃŰ´Â ¹æ½ÄÀ» ¸»ÇÑ´Ù°í ÇßÁÒ. ¿ø·¡ ¿ÀÇÂAI´Â 2015³â¿¡ °ÈÇнÀÀ» Áß½ÉÀ¸·Î ¼³¸³µÈ ȸ»ç¿´ÁÒ. ¿ÀÇÂAI´Â ÁøÁ¤ÇÑ ÀΰøÁö´É, Áï ¹ü¿ë ÀΰøÁö´ÉÀº °ÈÇнÀ¿¡ ÀÖ´Ù°í »ý°¢Çϴ ȸ»ç¿´°í, °ÈÇнÀ°ú °ü·ÃÇÑ ¿©·¯ ¶Ù¾î³ ³í¹®À» ¹ßÇ¥ÇÑ ¹Ù ÀÖ½À´Ï´Ù. °ÈÇнÀÀ¸·Î Àü ¼¼°è¿¡¼ °¡Àå À¯¸íÇÑ µÎ °³ ±â¾÷ Áß ÇϳªÀÔ´Ï´Ù. ´Ù¸¥ Çϳª´Â ¹Ù·Î ¾ËÆÄ°í·Î À¯¸íÇÑ ±¸±Û µö¸¶ÀεåÁÒ. ¿ÀÇÂAI´Â êGPT¿¡ °ÈÇнÀÀ» µµÀÔÇÕ´Ï´Ù. Àΰ£ Çǵå¹éÀ» ÀÌ¿ëÇÑ °ÈÇнÀ(Reinforcement Learning from Human Feedback), Áï RLHF ¶ó´Â ±â¹ýÀ» µµÀÔÇßÁÒ. ¿©±â¿¡´Â º¸»ó(Reward) ÇÔ¼ö·Î ±ÙÁ¢ Á¤Ã¥ ÃÖÀûÈ(Proximal Policy Optimization, PPO)¶ó´Â ¾Ë°í¸®ÁòÀ» »ç¿ëÇß½À´Ï´Ù.
RLHF °úÁ¤À» Á» ´õ ÀÚ¼¼È÷ »ìÆìº¸ÁÒ.
1´Ü°è°¡ SFT¿´´Ù¸é, RLHF¸¦ À§ÇÑ 2´Ü°è´Â ºñ±³ µ¥ÀÌÅ͸¦ ±¸ÃàÇÏ°í º¸»ó ¸ðµ¨(Reward Model)À» ÇнÀÇÏ´Â ´Ü°èÀÔ´Ï´Ù. ÀÌ ¸ðµ¨Àº RM ¸ðµ¨ÀÔ´Ï´Ù. RM ¸ðµ¨Àº ÇϳªÀÇ Áú¹®¿¡ ´ëÇØ ¿©·¯ ´äº¯À» µÎ°í ¾î¶² ´äº¯ÀÌ ¸¸Á·½º·¯¿îÁö ¼øÀ§¸¦ ¸Å±â´Â °úÁ¤À» °ÅĨ´Ï´Ù. ³í¹®¿¡ µû¸£¸é ¾à 4~9°³ Á¤µµÀÇ SFT ¸ðµ¨ÀÌ °¢°¢ ³»³õÀº ´Ù¸¥ ´äº¯À» µÎ°í »ç¶÷ÀÌ ¼±È£µµ¸¦ Æò°¡Çß´Ù°í ÇÕ´Ï´Ù. ¿¹¸¦ µé¾î ´äº¯ÀÌ A, B, C, D·Î 4°³¶ó¸é °¢°¢ÀÇ ¼±È£µµ¸¦ Æò°¡ÇØ D C A = B¿Í °°Àº ½ÄÀ¸·Î ¼øÀ§¸¦ ¸Å±ä °Ì´Ï´Ù. ´ç¿¬È÷ ¿©±â¼ °¡Àå ¸¶À½¿¡ µå´Â ´ë´äÀº D°¡ µÇ°Ú°í¿ä.
3´Ü°è´Â ½ÇÁ¦·Î °ÈÇнÀÀ» ÀÌ¿ëÇØ ¼º´ÉÀ» ³ôÀÌ´Â ´Ü°èÀÔ´Ï´Ù. ¾Õ¼ ¼Ò°³ÇÑ RM ¸ðµ¨À» ÀÌ¿ëÇØ º¸»óÀ» ÃÖÀûÈÇÏ´Â ´Ü°èÁÒ. ¿ÀÇÂAI´Â 2017³â, °ÔÀÓ¿¡ Àû¿ëÇϱâ À§ÇØ Á÷Á¢ °³¹ßÇß´ø ±ÙÁ¢ Á¤Ã¥ ÃÖÀûÈ(Proximal Policy Optimization, PPO)¶ó´Â °ÈÇнÀ ¾Ë°í¸®ÁòÀ» À̹ø¿¡´Â ¾ð¾î¿¡ Àû¿ëÇØº¾´Ï´Ù. À̸§ÀÌ ´Ù¼Ò »ý¼ÒÇØ º¸ÀÏ ¼ö ÀÖÁö¸¸ °ÈÇнÀ¿¡¼ º¸»óÀ» ¹Ý¿µÇÏ´Â ¾Ë°í¸®ÁòÀ¸·Î ÀÌÇØÇÏ¸é µË´Ï´Ù. ÀÌ·¯ÇÑ ¿ø¸®·Î ¸¸µç ¸ðµ¨ÀÇ À̸§Àº PPO ¸ðµ¨ÀÔ´Ï´Ù.
¹«¾ùº¸´Ù ÀÌ °úÁ¤Àº »ç¶÷ÀÌ °³ÀÔÇÏ¿© ÀÏÀÏÀÌ Æò°¡Çϰí ÇнÀÇÏ´Â °ÍÀÌ ¾Æ´Õ´Ï´Ù. RM ¸ðµ¨À» ±â¹ÝÀ¸·Î PPO ¾Ë°í¸®ÁòÀÌ Àü °úÁ¤À» ÀÚµ¿À¸·Î ÁøÇàÇÕ´Ï´Ù. Àΰ£ÀÇ °³ÀÔ ¾øÀÌ ¸ðµ¨ÀÌ ²÷ÀÓ¾øÀÌ ½º½º·Î ¹Ýº¹Çϸç ÇнÀÇÕ´Ï´Ù. ¹Ù·Î °ÈÇнÀÀÌÁÒ. 2016³â¿¡ ¾ËÆÄ°í°¡ º¸¿©Áá´ø ¹Ù·Î ±× ¹æ½Ä°ú µ¿ÀÏÇÕ´Ï´Ù. ´ç½Ã ¾ËÆÄ°í´Â »ç¶÷ÀÇ ±âº¸ºÎÅÍ ¸ÕÀú ÇнÀÇß½À´Ï´Ù. ¹ÙµÏ »çÀÌÆ®¿¡¼ 6´Ü ÀÌ»ó °í¼öÀÇ ±âº¸¸¦ º¸°í ÇнÀÇßÁÒ. ÇÏÁö¸¸ Àΰ£ÀÇ ±âº¸·Î ÇнÀÇß´ø ¾ËÆÄ°íÀÇ ½Ç·ÂÀº °íÀÛ 5´Ü Á¤µµ¿¡ ºÒ°úÇß½À´Ï´Ù. 9´ÜÀ» ³Ñ¾î ¼¼°è ÃÖ°íÀÎ À̼¼µ¹À» ²ª±â¿¡´Â ¸Å¿ì ºÎÁ·ÇÑ ½Ç·ÂÀ̾úÁÒ. ±×·¡¼ ¾ËÆÄ°í³¢¸® ²÷ÀÓ¾øÀÌ ´ë±¹À» Ä¡¸£¸é¼ ½º½º·Î ½Ç·ÂÀ» Çâ»ó½ÃÄ×½À´Ï´Ù. ÀÌ·¯ÇÑ °ÈÇнÀÀ» °ÅÃÄ ¾ËÆÄ°í´Â ¹ÙµÏ ½Ç·ÂÀ» ¸Å¿ì ³ôÀº ¼öÁØÀ¸·Î ²ø¾î¿Ã¸± ¼ö ÀÖ¾ú½À´Ï´Ù.
ÀÌó·³ »çÀü ÇнÀÀ» °ÅÄ£ ¸ðµ¨ÀÌ »ç¿ëÀÚ ÇÁ·ÒÇÁÆ®¸¦ Àß µû¸£µµ·Ï ¸¸µå´Â °úÁ¤À» »çÈÄ ÇнÀ(Post-Training)À̶ó°í ÇÕ´Ï´Ù. ¿ÀÇÂAI´Â 2022³â 11¿ù, ¸¶Ä§³» ÀÌ ±â¼úÀ» êGPT¶ó´Â À̸§À¸·Î ¼¼»ó¿¡ °ø°³ÇÕ´Ï´Ù. GPT-3¸¦ °ø°³ÇÑÁö 2³â 5°³¿ù ¸¸À̾úÁÒ.
ÀÌ·¸°Ô ÁøÈ °úÁ¤À» °ÅÄ£ êGPT´Â ÀÌÁ¦ ³î¶ó¿î ¼º´ÉÀ» º¸¿©ÁÝ´Ï´Ù. ¸¶Ä¡ »ç¶÷ó·³, ¾Æ´Ï ±× ¾î¶² »ç¶÷µµ ´ë´äÇÒ ¼ö ¾øÀ» °Í °°Àº ¾î·Á¿î Áú¹®¿¡µµ ¸·Èû¾øÀÌ Ã´Ã´ ´ë´äÇØ³À´Ï´Ù. ´ç¿¬È÷ »ç¶÷µéÀº ¿±¤Çß½À´Ï´Ù.
ÇÁ·ÒÇÁÆ® ¿£Áö´Ï¾î¸µÀÇ ¸¶¹ý
RAG, °Ë»öÀ¸·Î ¼º´ÉÀ» ³ôÀÌ´Â ¸¶¹ý
¾îÁ¦ ¿£ºñµð¾Æ ÁÖ°¡´Â ¾ó¸¶·Î ¸¶°¨Çß³ª¿ä?
ÀÌ·± Áú¹®¿¡ LLMÀÌ ´äº¯ÇÒ ¼ö ÀÖÀ»±î¿ä?
ÇÒ ¼ö ¾ø½À´Ï´Ù. LLMÀº ½Ç½Ã°£À¸·Î »õ·Î¿î Á¤º¸¸¦ ÇнÀÇÏ´Â ¸ðµ¨ÀÌ ¾Æ´Õ´Ï´Ù. ´ë°³´Â 6°³¿ù ¶Ç´Â 1³â Àü µ¥ÀÌÅ͸¦ ÀÌ¿ëÇØ »ó´çÈ÷ ¿À·£ ±â°£ ÇнÀÇØ ¸¸µé¾î³»ÁÒ. ¸»Àº ÀßÇÏÁö¸¸ »õ·Î¿î ¼Ò½Ä¿¡´Â µÐ°¨ÇÑ Ä£±¸ÀÔ´Ï´Ù. ¸¶Ä¡ ÇÐâ½ÃÀý Àü±³ 1µîÀÌÁö¸¸ ´º½º´Â ÀüÇô ¾È º¸´ø Ä£±¸¿Í ºñ½ÁÇÏÁÒ. ¾Æ¹«¸® Àü±³ 1µîÀ̾ ÃÖ±Ù °æÁ¦ ´º½º¸¦ º¸Áö ¾Ê´Â´Ù¸é ¾îÁ¦ ÁÖ°¡´Â °áÄÚ ¾Ë ¼ö°¡ ¾ø°ÚÁÒ. ±×·¸´Ù¸é LLMÀÌ ÀÌ·± Áú¹®¿¡ ´ë´äÇÏ°Ô ÇÏ·Á¸é ¾î¶»°Ô ÇØ¾ß ÇÒ±î¿ä? ¸¸¾à ´ÙÀ½°ú °°ÀÌ »ó´Ü¿¡ ÇÊ¿äÇÑ Á¤º¸¸¦ Á¦½ÃÇØÁÖ¸é ¾î¶³±î¿ä?
¿À´ÃÀº 2024³â 8¿ù 8ÀÏÀÔ´Ï´Ù.
¾îÁ¦´Â 2024³â 8¿ù 7ÀÏÀÔ´Ï´Ù.
2024³â 8¿ù 7ÀÏ ¿£ºñµð¾Æ 98.91´Þ·¯ ¸¶°¨
À§ ³»¿ëÀ» ¹ÙÅÁÀ¸·Î ´ÙÀ½ Áú¹®¿¡ ´ë´äÇØÁÖ¼¼¿ä.
¾îÁ¦ ¿£ºñµð¾Æ ÁÖ°¡´Â ¾ó¸¶·Î ¸¶°¨Çß³ª¿ä?
ÀÌÁ¦ LLMÀÌ ½±°Ô ´äÇÒ ¼ö ÀÖÀ» °Í °°³×¿ä. ¿Ö³ÄÇÏ¸é ´ë´ä¿¡ ÇÊ¿äÇÑ Á¤º¸°¡ »ó´Ü¿¡ ÀÌ¹Ì Á¦½ÃµÇ¾î Àֱ⠶§¹®ÀÌÁÒ. ¾Æ¸¶ ´ÙÀ½°ú °°ÀÌ ´äÇÒ °Å¿¹¿ä.
¾îÁ¦, 2024³â 8¿ù 7ÀÏ¿¡ ¿£ºñµð¾Æ ÁÖ°¡´Â 98.91 ´Þ·¯·Î ¸¶°¨Çß½À´Ï´Ù.
¹Ù·Î À§¿¡ Á¤´äÀÌ ³ª¿Í Àֱ⠶§¹®¿¡ ÀÌ Á¤µµ Áú¹®Àº ÃʵîÇлýµµ ´äº¯ÇÒ ¼ö Àְڳ׿ä. ÇÊ¿äÇÑ °Ç »ó´Ü¿¡ Á¤º¸¸¦ ä¿ì´Â ÀϹۿ¡ ¾ø½À´Ï´Ù. ±×·¸´Ù¸é Á¤º¸´Â ¾î¶»°Ô ä¿ï±î¿ä? ¾î·Æ°Ô »ý°¢ÇÒ ÇÊ¿ä ¾ø½À´Ï´Ù. ±×³É °Ë»öÇØ¼ ³»¿ëÀ» ä¿ì¸é µË´Ï´Ù. ¿À´Ã ³¯Â¥(8¿ù 8ÀÏ)¿Í ¾îÁ¦ ³¯Â¥(8¿ù 7ÀÏ)¸¦ Á¦½ÃÇÏ°í ¾îÁ¦ ³¯Â¥(8¿ù 7ÀÏ)ÀÇ ¿£ºñµð¾ÆÀÇ ÁÖ°¡¸¦ °Ë»öÇØ¼ Á¦½ÃÇÏ¸é µË´Ï´Ù. °Ë»ö¿£ÁøÀº 8¿ù 7ÀÏÀÇ ¿£ºñµð¾Æ ÁÖ°¡ Á¤µµ´Â ¾î·ÆÁö ¾Ê°Ô ã¾Æ¿Ã ¼ö ÀÖ°ÚÁÒ?
ÀÌ ±â¹ýÀÇ À̸§Àº RAGÀÔ´Ï´Ù. ¿ì¸® ¸»·Î ÇÏ¸é ¡®°Ë»ö Áõ° »ý¼º¡¯ Á¤µµ°¡ µÇ°Ú³×¿ä. °Ë»öÀÇ µµ¿òÀ» ¹Þ¾Æ ³»¿ëÀ» º¸¿ÏÇϰí À̸¦ ÅëÇØ LLMÀÇ »ý¼º ´É·ÂÀ» Áõ°½ÃŲ´Ù´Â ¸»ÀÌÁÒ. ¿ÜºÎ °Ë»öÀ̶ó¸é °Ë»ö¿£ÁøÀº ±¸±ÛÀ» »ç¿ëÇØµµ ÃæºÐÇÕ´Ï´Ù. ÁÖ°¡ Á¤º¸Ã³·³ °ø°³µÈ ¿ÜºÎ Á¤º¸¶ó¸é ¿ÀÈ÷·Á ±¸±Û¸¸ ÇÑ °Ô ¾øÁÒ.
¹«¾ùº¸´Ù RAG´Â LLMÀÇ °íÁúÀûÀÎ ¹®Á¦ÀÎ ÇÒ·ç½Ã³×À̼ÇÀ» ¹æÁöÇÑ´Ù´Â Á¡¿¡¼ Å©°Ô ÁÖ¸ñ¹Þ°í ÀÖ½À´Ï´Ù. ´äº¯ ÀÚü°¡ ½ÇÁ¦·Î ÃßÃâÇÑ °ü·Ã µ¥ÀÌÅÍ¿¡ ±â¹ÝÇϱ⠶§¹®¿¡ Á¤È®¼ºÀÌ ³ôÁÒ. ±×»Ó¸¸ ¾Æ´Ï¶ó µ¥ÀÌÅ͸¸ ÀÖÀ¸¸é µÇ¹Ç·Î ¾ðÁ¦µçÁö ÃֽŠÁ¤º¸¸¦ Á¦½ÃÇÒ ¼ö ÀÖÀ¸¸ç, À̸¦ ÅëÇØ LLMÀÌ À߸øµÈ Á¤º¸³ª ¿À·¡µÈ Á¤º¸¸¦ »ý¼ºÇÒ °¡´É¼ºµµ ÁÙÀÏ ¼ö ÀÖ½À´Ï´Ù.
Çѹø ¸¸µç ¸ðµ¨Àº ½±°Ô º¯°æÇÒ ¼ö ¾ø½À´Ï´Ù. ÇÏÁö¸¸ RAG´Â ÃֽŠÁ¤º¸¸¦ ÇÁ·ÒÇÁÆ® ÇüÅ·ΠÁÖÀÔ¸¸ ÇÏ¸é µÇ±â ¶§¹®¿¡ ¾ðÁ¦µç Á¤º¸¸¦ º¯°æÇÒ ¼ö ÀÖÁÒ. ¶ÇÇÑ Á¤º¸ÀÇ Ãâó¸¦ °ü¸®ÇÏ°í ¾÷µ¥ÀÌÆ®ÇÒ ¼ö ÀÖ¾î »ý¼ºµÈ ÀÀ´äÀÇ ³»¿ë°ú ¸Æ¶ôÀ» ´õ Àß Á¦¾îÇÒ ¼ö ÀÖ½À´Ï´Ù. ¹Î°¨ÇÑ Á¤º¸³ª »ç»ýȰÀÌ ³ëÃâµÇÁö ¾Êµµ·Ï Á¦¾îÇÏ´Â °Íµµ °¡´ÉÇÕ´Ï´Ù. ÀÌó·³ RAG´Â ¿©·¯¸ð·Î ÀåÁ¡ÀÌ ¸¹±â ¶§¹®¿¡ ÃÖ±Ù LLM¿¡ RAG´Â °ÅÀÇ Çʼö·Î ¾²À̰í ÀÖ½À´Ï´Ù.
¿ÀÇÂAI o1, »ý°¢À» °ÅµìÇÒ¼ö·Ï ´õ ÁÁÀº °á°ú¸¦ Á¦½ÃÇÏ´Ù
2024³â 9¿ù, ¿ÀÇÂAI´Â »õ·Î¿î ¸ðµ¨À» °ø°³ÇÕ´Ï´Ù. o1À̶ó´Â À̸§À̾úÁÒ. GPT-4o ÀÌÈÄ¿¡ µîÀåÇÑ ÈÄ¼Ó ¸ðµ¨ÀÔ´Ï´Ù. ÀÌ ¸ðµ¨Àº °ø°³µÇÀÚ¸¶ÀÚ ³î¶ó¿î ¼º´ÉÀ» º¸¿©ÁÝ´Ï´Ù. ¿ª´ë ÃÖ°í ¼º´ÉÀ̾úÁÒ. À̸§µµ ƯÀÌÇÕ´Ï´Ù. ±âÁ¸¿¡ Ç×»ó »ç¿ëÇÏ´ø GPT¶ó´Â À̸§À» »ç¿ëÇÏÁö ¾Ê¾ÒÁÒ. ÀÌ ¾ê±â´Â GPT¿Í´Â ´Ù¸¥ ÇüÅÂÀÇ ¸ðµ¨À̶ó´Â ¶æÀ̱⵵ ÇÕ´Ï´Ù. ºÐ¸íÈ÷ ¼º´ÉÀÌ ÈξÀ ´õ ÁÁÀº »õ·Î¿î ¸ðµ¨Àε¥ À̸§ÀÌ GPT°¡ ¾Æ´Ï¶ó ±×Àú o1À̶ó´Ï ÀÌ »õ·Î¿î ¸ðµ¨ÀÇ Á¤Ã¼´Â °ú¿¬ ¹«¾ùÀϱî¿ä?
o1ÀÇ ¸ðµ¨ ÀÚü´Â ±âÁ¸ GPT ¸ðµ¨°ú Å©°Ô ´Ù¸£Áö ¾Ê½À´Ï´Ù. ´ë½Å ¹®Àå »ý¼º ´Ü°è¿¡¼, ±×·¯´Ï±î Ãß·Ð ´Ü°è¿¡¼ ¿©·¯ µ¶Æ¯ÇÑ ±â¹ýÀ» Ȱ¿ëÇØ ¼º´ÉÀ» ³ô¿´ÁÒ.
±âÁ¸¿¡ LLMÀº ÇÑ ¹ø ¿äûÇÏ¸é ³¡ÀÔ´Ï´Ù. ¸ðµ¨ÀÌ ´äº¯À» ³»³õÀ¸¸é ±×·¸°Ô ´ëȰ¡ Á¾·áµÇÁÒ. ÇÏÁö¸¸ ´äº¯ÀÌ ¸¶À½¿¡ µéÁö ¾Ê´Â´Ù¸é »ç¶÷ÀÌ Á÷Á¢ ÇÁ·ÒÇÁÆ® ¿£Áö´Ï¾î¸µÀ» ÅëÇØ Áú¹®À» °³¼±ÇÏ¿© ´Ù½Ã ¿äûÇÒ ¼ö ÀÖ½À´Ï´Ù. ±×·¸°Ô ¿äûÀ» ¹Ýº¹ÇÏ´Ù º¸¸é ´õ ÁÁÀº ´äº¯À» ±â´ëÇÒ ¼ö ÀÖÀ» °Å°í¿ä. ÃÖÁ¾ÀûÀ¸·Î °¡Àå ÁÁÀº ´äº¯À» À̲ø¾î³¾ ¼ö ÀÖ½À´Ï´Ù. ÇÁ·ÒÇÁÆ® ¿£Áö´Ï¾î¸µÀÌ ¹Ù·Î ÀÌ·± °úÁ¤À̰í, ÀÌÀü±îÁö´Â ÀÌ °úÁ¤À» ÁÖ·Î »ç¶÷ÀÌ Á÷Á¢ ÆÇ´ÜÇϸç ÁøÇàÇß½À´Ï´Ù.
ÇÏÁö¸¸ o1Àº ÀÌ °úÁ¤À» ¸¶Ä¡ ÀÚµ¿ÈÇÑ °Í°ú ºñ½ÁÇÕ´Ï´Ù.
o1Àº »ý°¢ÇÏ´Â(Thinking) °úÁ¤À» µµÀÔÇØ ÇÁ·ÒÇÁÆ®¸¦ ´Ü°èÀûÀ¸·Î °íµµÈÇÕ´Ï´Ù. ù ¹øÂ° ÀÀ´ä¿¡¼ ÇÁ·ÒÇÁÆ®¸¦ º¸¿ÏÇÏ°í ´Ù½Ã Áú¹®Çϸç, ´Ù½Ã ±× ÀÀ´äÀ» ÀÌ¿ëÇØ ÇÁ·ÒÇÁÆ®¸¦ Á» ´õ º¸¿ÏÇÏ´Â ½ÄÀÌÁÒ. ÀÌ·± ½ÄÀ¸·Î ¿©·¯ ´Ü°è¿¡ °ÉÃÄ ÇÁ·ÒÇÁÆ®¸¦ °è¼Ó °íµµÈÇϰí ÃÖÁ¾ÀûÀ¸·Î °¡Àå ÁÁÀº ´äº¯À» µµÃâÇØ³À´Ï´Ù. ±×·¯´Ï±î ¿ø·¡´Â »ç¶÷ÀÌ ÇÏ´ø ÇÁ·ÒÇÁÆ® ¿£Áö´Ï¾î¸µÀ» ¸ðµÎ ÀÚµ¿ÈÇØ¼ ó¸®ÇÏ´Â °Í°ú ºñ½ÁÇÏÁÒ. ±×·¸°Ô ¸¶Áö¸·À¸·Î »ý¼ºµÈ ´äº¯Àº ǰÁúÀÌ ¸Å¿ì ÁÁ½À´Ï´Ù. Áö±Ý±îÁö ³ª¿Â ¸ðµ¨ Áß¿¡¼ °¡Àå ÁÁÁÒ.
ÀÌó·³ o1ÀÌ ÁÁÀº °á°ú¸¦ º¸¿©ÁØ ¸¸Å ¾ÕÀ¸·Î´Â Ãß·Ð °úÁ¤À» °íµµÈÇÏ¸é¼ ±× °úÁ¤¿¡ °è»ê ½Ã°£À» ÇÒ¾ÖÇÏ´Â »ç·Ê°¡ ´õ ¸¹ÀÌ ´Ã¾î³¯ °Ì´Ï´Ù. À̸¦ Å×½ºÆ® ŸÀÓ ½ºÄÉÀϸµ(Test-Time Scaling)À̶ó°í Çϴµ¥¿ä, Ãß·Ð °úÁ¤¿¡ ½Ã°£À» ÇÒ¾ÖÇÒ¼ö·Ï ¼º´ÉÀº ´õ¿í ÁÁ¾ÆÁø´Ù´Â ¾ê±âÁÒ. ƯÈ÷ o1 ÀÌÈķδ »ç¶÷ÀÌ Á÷Á¢ ÇÁ·ÒÇÁÆ® ¿£Áö´Ï¾î¸µÀ» Çϱ⺸´Ù LLMÀÌ ÀÚµ¿À¸·Î Ãß·Ð °úÁ¤¿¡ ½Ã°£À» ÇÒ¾ÖÇØ ¼º´ÉÀ» ³ôÀÌ´Â ¿¬±¸°¡ ´Ã°í ÀÖ½À´Ï´Ù.
* * *
º» Á¤º¸´Â µµ¼ÀÇ ÀϺΠ³»¿ëÀ¸·Î¸¸ ±¸¼ºµÇ¾î ÀÖÀ¸¸ç, º¸´Ù ¸¹Àº Á¤º¸¿Í Áö½ÄÀº ¹Ýµå½Ã Ã¥À» ÂüÁ¶ÇÏ¼Å¾ß ÇÕ´Ï´Ù.