[ºÎ¼¼Ò°³]
ÀúÈñ ºÎ¼´Â AI ¸ðµ¨À» ÀÖ´Â ±×´ë·Î µÎÁö ¾Ê°í, °æ·®ÈÇϰųª ¾ÐÃàÇÏ´Â ¾Ë°í¸®ÁòÀ» Àû±Ø Àû¿ëÇÕ´Ï´Ù.
LLM ¼ºñ½º°¡ ¹ßÀüÇÔ¿¡ µû¶ó LLMÀ» »ý¼ºÇϱâ À§ÇÑ ÇнÀ pipelineÀº Á¡Á¡ º¹ÀâÇØÁö°í °íµµÈµÇ°í ÀÖÀ¸¸ç, ÀÌ·¯ÇÑ pipelineÀ» °í·ÁÇÑ °æ·®È strategy ¿¬±¸/°³¹ßÀ» ¹ÙÅÁÀ¸·Î ½ÇÁúÀûÀÎ ¼ºñ½º ºñ¿ëÀ» Àý°¨ÇÏ°í ¼Óµµ¸¦ Çâ»ó½ÃŰ´Â µ¥ ÃÊÁ¡À» ¸ÂÃß°í ÀÖ½À´Ï´Ù. ÀÌ·¯ÇÑ °úÁ¤¿¡¼ LLM Ãß·Ð ¹× ÇнÀ¿¡¼ÀÇ ºñ¿ëÀ» ÁÙÀ̱â À§ÇÑ °æ·®È ¾Ë°í¸®Áò ¿¬±¸/°³¹ßÀ» ÁýÁßÇϰí ÀÖ½À´Ï´Ù. ´Ù¾çÇÑ °æ·®È ¾Ë°í¸®Áò µéÀ» Àû¿ëÇϰí, Àû¿ëÇÑ °æ·®È LLMÀ» Æò°¡ÇÔÀ¸·Î½á, ±âÁ¸ °æ·®È ±â¼úµéÀÌ °¡Áø ÇѰ質 ¹®Á¦Á¡À» ÆÄ¾ÇÇϰí, »õ·Î¿î ¾Ë°í¸®ÁòÀ» ¿¬±¸/°³¹ßÇÏ°Ô µË´Ï´Ù. ÀÌ·¸°Ô ¿¬±¸/°³¹ßµÈ ±â¼úÀº HyperCLOVA X¸¦ Æ÷ÇÔÇÑ ´Ù¾çÇÑ ¼ºñ½ºÀÇ ºñ¿ë°ú ǰÁúÀ» °³¼±Çϱâ À§ÇØ Àû¿ëµË´Ï´Ù.
[´ã´ç¾÷¹«]
- LLM Ãß·Ð ¹× ÇнÀ¿¡¼ÀÇ ºñ¿ëÀ» ÁÙÀ̱â À§ÇÑ °æ·®È ¾Ë°í¸®Áò ¿¬±¸ ¹× °³¹ß
- ÃֽŠ°æ·®È ±â¹ý ±¸Çö, Àû¿ë, ºÐ¼® ¹× °æ·®È LLM Æò°¡
- °æ·®È·Î ÀÎÇØ ¹ß»ýÇÒ ¼ö ÀÖ´Â °¢Á¾ corner case ºÐ¼® ¹× ÇØ°á
- ½ÇÁ¦ ¼ºñ½º¿¡ Àû¿ë °¡´ÉÇÑ ¼öÁØÀÇ °æ·®È/ÃÖÀûÈ ¿¬±¸ µî
- HyperCLOVA XÀÇ À¯°üºÎ¼ (¸ðµ¨, ÀÎÇÁ¶ó, Post-training ºÎ¼)¿Í Çù¾÷ µî
[ÀÚ°Ý¿ä°Ç]
- LLM °æ·®È/ÃÖÀûÈ ¿¬±¸/°³¹ß °æÇèÀÌ ³ôÀº 3³â ÀÌ»óÀÇ °æ·ÂÀÚ
- º»ÀÎÀÇ ÀÛ¾÷ÀÇ °á°ú·Î ¼º´ÉÀÌ °³¼±µÇ°í Çâ»óµÇ´Â ±× ÀÚü¿¡ Áñ°Å¿òÀ» ´À³¢½Ã´Â ºÐ
- LLM Quantization / Pruning / Distillation µîÀÇ °æ·®È ¾Ë°í¸®Áò ¿¬±¸/°³¹ß °æÇèÀ» º¸À¯ÇϽŠºÐ
- LLM Æò°¡¿¡ Àͼ÷Çϰųª ¸¹Àº ¸ðµ¨¿¡ Æò°¡¸¦ ÇØº¸½Å ºÐ
- ´ë±Ô¸ð ºÐ»êÇнÀ frameworks(FSDP, Deepspeed, Megatron-lm, NeMo, Torchtitan)¸¦ ´Ù·é °æÇèÀ» º¸À¯ÇϽŠºÐ
[¿ì´ë»çÇ×]
- Large-scale LM ÇнÀ ½Ã½ºÅÛ ¿î¿µ/°³¹ß/ÃÖÀûÈ °æÇèÀ» º¸À¯ÇϽŠºÐ
- SW ArchitecturingÀ» ÅëÇØ È®Àå °¡´ÉÇÑ ±¸Á¶ ¼³°è¸¦ ¾÷¹«¿¡ ³ì¿©³¾ ¼ö ÀÖ´Â ºÐ
- °æ·®È °ü·Ã ³í¹® Publish ½ÇÀûÀ» º¸À¯ÇϽŠºÐ
[ºÎ¼¼Ò°³]
ÀúÈñ ºÎ¼´Â ´ë±Ô¸ð ¾ð¾î ¸ðµ¨(LLM)ÀÇ Ãß·Ð ½Ã½ºÅÛÀ» °³¹ßÇϰí ÃÖÀûÈÇÏ¿© °í¼º´É API ¼ºñ½º¸¦ Á¦°øÇÏ´Â °ÍÀ» ¸ñÇ¥·Î ÇÕ´Ï´Ù.
ÀúÈñ´Â vLLM, TRT-LLM µî ¿ÀǼҽº ÀÎÆÛ·±½º ¿£ÁøÀ» Ȱ¿ëÇÏ¿© È¿À²ÀûÀÎ ¸ðµ¨ ¼ºùÀ» ±¸ÇöÇϰí, ÃֽŠÇϵå¿þ¾î(H100, A100, Gaudi2 µî)¿Í ¼ÒÇÁÆ®¿þ¾î ½ºÅÃÀ» ÅëÇÕÇÏ¿© ¾ÈÁ¤ÀûÀ̰í È®Àå °¡´ÉÇÑ ½Ã½ºÅÛÀ» ±¸ÃàÇÕ´Ï´Ù.
À̸¦ ÅëÇØ ´Ù¾çÇÑ ¼ºñ½º¿¡ °íǰÁúÀÇ LLM ±â´ÉÀ» Á¦°øÇϰíÀÚ ÇÕ´Ï´Ù.
[´ã´ç¾÷¹«]
- vLLM ±â¹Ý LLM Ãß·Ð ¿£ÁøÀÇ ¼º´É ÃÖÀûÈ ¹× ±â´É °³¹ß
- Tensor Parallelism, FlashAttention, Speculative Decoding µî Ãֽбâ¹ýÀ» Ȱ¿ëÇÑ Ãß·Ð ¼º´É Çâ»ó
- GPU Ŭ·¯½ºÅÍ(K8s, Helm, LWS µî) ȯ°æ¿¡¼ÀÇ ´ë±Ô¸ð LLM ¼ºñ½º ¿î¿µ ¹× ÃÖÀûÈ
- LangChain, RAG µî ÃֽŠÇÁ·¹ÀÓ¿öÅ©¸¦ Ȱ¿ëÇÏ¿© ´Ù¾çÇÑ LLM ±â¹Ý ÀÀ¿ë ¼ºñ½º °³¹ß ¹× ±âÁ¸ ½Ã½ºÅÛ ÅëÇÕ
- Llama Stack ±â¹ÝÀÇ Application SDK °³¹ß ¹× API ¼ºñ½ºÈ
[ÀÚ°Ý¿ä°Ç]
- ÃÖ¼Ò 1³â ÀÌ»óÀÇ À¯°ü °æ·Â
- ´ë±Ô¸ð LLM ¸ðµ¨ÀÇ Ãß·Ð ¶Ç´Â ÇнÀ ½Ã½ºÅÛ °³¹ß °æÇèÀ» º¸À¯ÇϽŠºÐ
- LLM Ãß·Ð ÃÖÀûÈ ±â¹ý¿¡ ´ëÇÑ ÀÌÇØ ¹× Àû¿ë °æÇèÀ» º¸À¯ÇϽŠºÐ
- C/C++ ¹× Python¿¡ ´ëÇÑ ¼÷·Ãµµ¿Í ¸Þ¸ð¸® °ü¸®¿¡ ´ëÇÑ ÀÌÇØ¸¦ °®Ã߽ŠºÐ
- º¹ÀâÇÑ ¹®Á¦¸¦ ü°èÀûÀ¸·Î ºÐ¼®Çϰí ÇØ°áÇÒ ¼ö ÀÖ´Â ´É·ÂÀ» º¸À¯ÇϽŠºÐ
- Kubernetes ±â¹ÝÀÇ Å¬·¯½ºÅÍ È¯°æ¿¡¼ÀÇ ¼ºñ½º ¿î¿µ °æÇèÀ» º¸À¯ÇϽŠºÐ
[¿ì´ë»çÇ×]
- vLLM, TRT-LLM µî LLM Ãß·Ð ¿£Áø °³¹ß °æÇèÀ» º¸À¯ÇϽŠºÐ
- Speculative Decoding, FlashAttention µî ÃֽŠÃß·Ð ÃÖÀûÈ ±â¹ý¿¡ ´ëÇÑ ÀÌÇØ¸¦ °®Ã߽ŠºÐ
- H100, A100, Gaudi2 µî ÃֽŠAI °¡¼Ó±â Çϵå¿þ¾î¿¡ ´ëÇÑ °æÇèÀ» º¸À¯ÇϽŠºÐ
- LLM ±â¹Ý API ¼ºñ½º °³¹ß ¹× ¿î¿µ °æÇèÀ» º¸À¯ÇϽŠºÐ
- LLM Ãß·Ð ÃÖÀûÈ¿¡ ´ëÇÑ ¿¬±¸ ¶Ç´Â ¿ÀǼҽº ±â¿© °æÇèÀ» º¸À¯ÇϽŠºÐ
[ÀüÇüÀýÂ÷]
¼·ù ÀüÇü(±â¾÷¹®ÈÀûÇÕµµ °Ë»ç ¹× Á÷¹«Å×½ºÆ® Æ÷ÇÔ) ¢º Á÷¹« ÀÎÅÍºä ¢º ·¹ÆÛ·±½ºÃ¼Å© ¹× Á¾ÇÕ ÀÎÅÍºä ¢º ó¿ìÇùÀÇ ¢º ÃÖÁ¾ÇÕ°Ý
¡Ø ÀϺΠÁ÷¹«ÀÇ °æ¿ì ¼·ùÀüÇü¿¡ Á÷¹«Å×½ºÆ®°¡ Æ÷Ç﵃ ¼ö ÀÖ½À´Ï´Ù.
¡Ø ÀüÇü ÀýÂ÷´Â ÀÏÁ¤ ¹× »óȲ¿¡ µû¶ó º¯µ¿µÉ ¼ö ÀÖÀ¸¸ç, ÀüÇüº° °á°ú¿¡ µû¶ó ÀýÂ÷(Ãß°¡ ÀÎÅÍºä µî)°¡ Ãß°¡µÉ ¼ö ÀÖ½À´Ï´Ù.
¡Ø Á¤ÇØÁø °á°ú ¹ßÇ¥ ÀÏÁ¤Àº ¾øÀ¸¸ç, Áö¿ø¼ °ËÅä ÈÄ ¸éÁ¢ ÀÏÁ¤Àº ´ë»óÀÚ¿¡°Ô °³º°·Î ¾È³»µå¸± ¿¹Á¤ÀÔ´Ï´Ù.
[±Ù¹«Áö]
°æ±â ¼º³²½Ã ºÐ´ç±¸ ºÒÁ¤·Î 6 (±×¸°ÆÑÅ丮)
¡Ø ±Ù¹«Áö´Â ȸ»ç ³»ºÎ »çÁ¤¿¡ µû¶ó º¯µ¿µÉ ¼ö ÀÖ½À´Ï´Ù.
[±âŸ»çÇ×]
- º» °ø°í´Â Áߺ¹Áö¿øÀÌ ºÒ°¡´ÉÇϸç, ±âÁøÇàÇÑ Æ÷Áö¼Ç¿¡ ´ëÇÑ ÀüÇüÀÌ ¸ðµÎ ¸¶¹«¸® µÇ¸é ´Ù¸¥ Æ÷Áö¼ÇÀ¸·Î Áö¿øÀÌ °¡´ÉÇÕ´Ï´Ù.
- ÇØ¿Ü ÃâÀå¿¡ °á°Ý »çÀ¯°¡ ¾ø´Â ºÐ¸¸ Áö¿ø °¡´ÉÇÕ´Ï´Ù.
- º´¿ª Àǹ«¸¦ ÇÊÇÑ ÀÚ È¤Àº ¸éÁ¦µÈ ÀÚ(³²¼ºÀÇ °æ¿ì)¿¡ ÇÑÇØ ÀÔ»çÁö¿øÀÌ °¡´ÉÇÕ´Ï´Ù.
- Áö¿ø¼ »ó ÇãÀ§ ±âÀç°¡ Àְųª Á¦Ãâ ¼·ù°¡ ÇãÀ§ÀÎ °æ¿ì ÇÕ°ÝÀÌ Ãë¼ÒµÉ ¼ö ÀÖ½À´Ï´Ù.
- Á¦ÃâµÈ Áö¿ø¼´Â [My page- Áö¿øÇöȲ]¿¡¼ È®ÀÎ °¡´ÉÇϸç, °ø°í ¸¶°¨ Àü±îÁö ȨÆäÀÌÁö¿¡¼ ¼öÁ¤ ¹× Áö¿ø öȸ°¡ °¡´ÉÇÕ´Ï´Ù.
- º» °ø°í´Â ÀÎÀç ¼±¹ß ¿Ï·á ½Ã Á¶±â ¸¶°¨µÉ ¼ö ÀÖÀ¸¸ç, ÇÊ¿ä ½Ã ¸ðÁý ±â°£ÀÌ ¿¬ÀåµÉ ¼ö ÀÖ½À´Ï´Ù.
- ±¹°¡À¯°øÀÚ ¹× Àå¾ÖÀÎ µî Ãë¾÷º¸È£ ´ë»óÀÚ´Â °ü°è¹ý·É¿¡ µû¶ó ¿ì´ëÇÕ´Ï´Ù.
- ±¹°¡À¯°øÀÚÀÇ °¡»êÁ¡ ºÎ¿©¸¦ ¹Þ±â À§Çؼ´Â º»ÀÎÀÌ 'Ãë¾÷Áö¿ø ´ë»óÀÚ Áõ¸í¼'¸¦ ȸ»ç¿¡ Á¦ÃâÇØ¾ß ÇÕ´Ï´Ù.
- Á¦ÃâÇØÁֽŠÁö¿ø¼ÀÇ °ËÅä °á°ú ¹ßÇ¥´Â Áö¿ø¼¿¡ µî·ÏÇϽŠÀ̸ÞÀÏ·Î °³º° ¾È³»µå¸³´Ï´Ù.
- ÀÔ»ç ÈÄ 3°³¿ùÀÇ ¼ö½À ±â°£À» Àû¿ëÇÏ¸ç Æò°¡¿¡ µû¶ó ¼ö½À ±â°£ÀÌ ¿¬ÀåµÇ°Å³ª ä¿ëÀÌ Ãë¼ÒµÉ ¼ö ÀÖ½À´Ï´Ù.
- ¹®ÀÇ»çÇ×Àº NAVER Cloud ä¿ë ȨÆäÀÌÁö 1:1 ¹®ÀÇ·Î Á¢¼öÇØÁֽñ⠹ٶø´Ï´Ù.