LLM Training/Inference °æ·®È­ ¿¬±¸/°³¹ß



[ºÎ¼­¼Ò°³]

ÀúÈñ ºÎ¼­´Â AI ¸ðµ¨À» ÀÖ´Â ±×´ë·Î µÎÁö ¾Ê°í, °æ·®È­Çϰųª ¾ÐÃàÇÏ´Â ¾Ë°í¸®ÁòÀ» Àû±Ø Àû¿ëÇÕ´Ï´Ù.

LLM ¼­ºñ½º°¡ ¹ßÀüÇÔ¿¡ µû¶ó LLMÀ» »ý¼ºÇϱâ À§ÇÑ ÇнÀ pipelineÀº Á¡Á¡ º¹ÀâÇØÁö°í °íµµÈ­µÇ°í ÀÖÀ¸¸ç, ÀÌ·¯ÇÑ pipelineÀ» °í·ÁÇÑ °æ·®È­ strategy ¿¬±¸/°³¹ßÀ» ¹ÙÅÁÀ¸·Î ½ÇÁúÀûÀÎ ¼­ºñ½º ºñ¿ëÀ» Àý°¨ÇÏ°í ¼Óµµ¸¦ Çâ»ó½ÃŰ´Â µ¥ ÃÊÁ¡À» ¸ÂÃß°í ÀÖ½À´Ï´Ù. ÀÌ·¯ÇÑ °úÁ¤¿¡¼­ LLM Ãß·Ð ¹× ÇнÀ¿¡¼­ÀÇ ºñ¿ëÀ» ÁÙÀ̱â À§ÇÑ °æ·®È­ ¾Ë°í¸®Áò ¿¬±¸/°³¹ßÀ» ÁýÁßÇϰí ÀÖ½À´Ï´Ù. ´Ù¾çÇÑ °æ·®È­ ¾Ë°í¸®Áò µéÀ» Àû¿ëÇϰí, Àû¿ëÇÑ °æ·®È­ LLMÀ» Æò°¡ÇÔÀ¸·Î½á, ±âÁ¸ °æ·®È­ ±â¼úµéÀÌ °¡Áø ÇѰ質 ¹®Á¦Á¡À» ÆÄ¾ÇÇϰí, »õ·Î¿î ¾Ë°í¸®ÁòÀ» ¿¬±¸/°³¹ßÇÏ°Ô µË´Ï´Ù. ÀÌ·¸°Ô ¿¬±¸/°³¹ßµÈ ±â¼úÀº HyperCLOVA X¸¦ Æ÷ÇÔÇÑ ´Ù¾çÇÑ ¼­ºñ½ºÀÇ ºñ¿ë°ú ǰÁúÀ» °³¼±Çϱâ À§ÇØ Àû¿ëµË´Ï´Ù.


[´ã´ç¾÷¹«]

- LLM Ãß·Ð ¹× ÇнÀ¿¡¼­ÀÇ ºñ¿ëÀ» ÁÙÀ̱â À§ÇÑ °æ·®È­ ¾Ë°í¸®Áò ¿¬±¸ ¹× °³¹ß

- ÃֽŠ°æ·®È­ ±â¹ý ±¸Çö, Àû¿ë, ºÐ¼® ¹× °æ·®È­ LLM Æò°¡

- °æ·®È­·Î ÀÎÇØ ¹ß»ýÇÒ ¼ö ÀÖ´Â °¢Á¾ corner case ºÐ¼® ¹× ÇØ°á

- ½ÇÁ¦ ¼­ºñ½º¿¡ Àû¿ë °¡´ÉÇÑ ¼öÁØÀÇ °æ·®È­/ÃÖÀûÈ­ ¿¬±¸ µî

- HyperCLOVA XÀÇ À¯°üºÎ¼­ (¸ðµ¨, ÀÎÇÁ¶ó, Post-training ºÎ¼­)¿Í Çù¾÷ µî


[ÀÚ°Ý¿ä°Ç]

- LLM °æ·®È­/ÃÖÀûÈ­ ¿¬±¸/°³¹ß °æÇèÀÌ ³ôÀº 3³â ÀÌ»óÀÇ °æ·ÂÀÚ

- º»ÀÎÀÇ ÀÛ¾÷ÀÇ °á°ú·Î ¼º´ÉÀÌ °³¼±µÇ°í Çâ»óµÇ´Â ±× ÀÚü¿¡ Áñ°Å¿òÀ» ´À³¢½Ã´Â ºÐ

- LLM Quantization / Pruning / Distillation µîÀÇ °æ·®È­ ¾Ë°í¸®Áò ¿¬±¸/°³¹ß °æÇèÀ» º¸À¯ÇϽŠºÐ

- LLM Æò°¡¿¡ Àͼ÷Çϰųª ¸¹Àº ¸ðµ¨¿¡ Æò°¡¸¦ ÇØº¸½Å ºÐ

- ´ë±Ô¸ð ºÐ»êÇнÀ frameworks(FSDP, Deepspeed, Megatron-lm, NeMo, Torchtitan)¸¦ ´Ù·é °æÇèÀ» º¸À¯ÇϽŠºÐ


[¿ì´ë»çÇ×]

- Large-scale LM ÇнÀ ½Ã½ºÅÛ ¿î¿µ/°³¹ß/ÃÖÀûÈ­ °æÇèÀ» º¸À¯ÇϽŠºÐ

- SW ArchitecturingÀ» ÅëÇØ È®Àå °¡´ÉÇÑ ±¸Á¶ ¼³°è¸¦ ¾÷¹«¿¡ ³ì¿©³¾ ¼ö ÀÖ´Â ºÐ

- °æ·®È­ °ü·Ã ³í¹® Publish ½ÇÀûÀ» º¸À¯ÇϽŠºÐ

LLM Inference Engine ÃÖÀûÈ­ ¿¬±¸/°³¹ß



[ºÎ¼­¼Ò°³]

ÀúÈñ ºÎ¼­´Â ´ë±Ô¸ð ¾ð¾î ¸ðµ¨(LLM)ÀÇ Ãß·Ð ½Ã½ºÅÛÀ» °³¹ßÇϰí ÃÖÀûÈ­ÇÏ¿© °í¼º´É API ¼­ºñ½º¸¦ Á¦°øÇÏ´Â °ÍÀ» ¸ñÇ¥·Î ÇÕ´Ï´Ù.

ÀúÈñ´Â vLLM, TRT-LLM µî ¿ÀǼҽº ÀÎÆÛ·±½º ¿£ÁøÀ» Ȱ¿ëÇÏ¿© È¿À²ÀûÀÎ ¸ðµ¨ ¼­ºùÀ» ±¸ÇöÇϰí, ÃֽŠÇϵå¿þ¾î(H100, A100, Gaudi2 µî)¿Í ¼ÒÇÁÆ®¿þ¾î ½ºÅÃÀ» ÅëÇÕÇÏ¿© ¾ÈÁ¤ÀûÀ̰í È®Àå °¡´ÉÇÑ ½Ã½ºÅÛÀ» ±¸ÃàÇÕ´Ï´Ù.

À̸¦ ÅëÇØ ´Ù¾çÇÑ ¼­ºñ½º¿¡ °íǰÁúÀÇ LLM ±â´ÉÀ» Á¦°øÇϰíÀÚ ÇÕ´Ï´Ù.


[´ã´ç¾÷¹«]

- vLLM ±â¹Ý LLM Ãß·Ð ¿£ÁøÀÇ ¼º´É ÃÖÀûÈ­ ¹× ±â´É °³¹ß

- Tensor Parallelism, FlashAttention, Speculative Decoding µî Ãֽбâ¹ýÀ» Ȱ¿ëÇÑ Ãß·Ð ¼º´É Çâ»ó

- GPU Ŭ·¯½ºÅÍ(K8s, Helm, LWS µî) ȯ°æ¿¡¼­ÀÇ ´ë±Ô¸ð LLM ¼­ºñ½º ¿î¿µ ¹× ÃÖÀûÈ­

- LangChain, RAG µî ÃֽŠÇÁ·¹ÀÓ¿öÅ©¸¦ Ȱ¿ëÇÏ¿© ´Ù¾çÇÑ LLM ±â¹Ý ÀÀ¿ë ¼­ºñ½º °³¹ß ¹× ±âÁ¸ ½Ã½ºÅÛ ÅëÇÕ

- Llama Stack ±â¹ÝÀÇ Application SDK °³¹ß ¹× API ¼­ºñ½ºÈ­


[ÀÚ°Ý¿ä°Ç]

- ÃÖ¼Ò 1³â ÀÌ»óÀÇ À¯°ü °æ·Â

- ´ë±Ô¸ð LLM ¸ðµ¨ÀÇ Ãß·Ð ¶Ç´Â ÇнÀ ½Ã½ºÅÛ °³¹ß °æÇèÀ» º¸À¯ÇϽŠºÐ

- LLM Ãß·Ð ÃÖÀûÈ­ ±â¹ý¿¡ ´ëÇÑ ÀÌÇØ ¹× Àû¿ë °æÇèÀ» º¸À¯ÇϽŠºÐ

- C/C++ ¹× Python¿¡ ´ëÇÑ ¼÷·Ãµµ¿Í ¸Þ¸ð¸® °ü¸®¿¡ ´ëÇÑ ÀÌÇØ¸¦ °®Ã߽ŠºÐ

- º¹ÀâÇÑ ¹®Á¦¸¦ ü°èÀûÀ¸·Î ºÐ¼®Çϰí ÇØ°áÇÒ ¼ö ÀÖ´Â ´É·ÂÀ» º¸À¯ÇϽŠºÐ

- Kubernetes ±â¹ÝÀÇ Å¬·¯½ºÅÍ È¯°æ¿¡¼­ÀÇ ¼­ºñ½º ¿î¿µ °æÇèÀ» º¸À¯ÇϽŠºÐ


[¿ì´ë»çÇ×]

- vLLM, TRT-LLM µî LLM Ãß·Ð ¿£Áø °³¹ß °æÇèÀ» º¸À¯ÇϽŠºÐ

- Speculative Decoding, FlashAttention µî ÃֽŠÃß·Ð ÃÖÀûÈ­ ±â¹ý¿¡ ´ëÇÑ ÀÌÇØ¸¦ °®Ã߽ŠºÐ

- H100, A100, Gaudi2 µî ÃֽŠAI °¡¼Ó±â Çϵå¿þ¾î¿¡ ´ëÇÑ °æÇèÀ» º¸À¯ÇϽŠºÐ

- LLM ±â¹Ý API ¼­ºñ½º °³¹ß ¹× ¿î¿µ °æÇèÀ» º¸À¯ÇϽŠºÐ

- LLM Ãß·Ð ÃÖÀûÈ­¿¡ ´ëÇÑ ¿¬±¸ ¶Ç´Â ¿ÀǼҽº ±â¿© °æÇèÀ» º¸À¯ÇϽŠºÐ

ÀüÇüÀýÂ÷ ¹× ±âŸ»çÇ×

[ÀüÇüÀýÂ÷]

¼­·ù ÀüÇü(±â¾÷¹®È­ÀûÇÕµµ °Ë»ç ¹× Á÷¹«Å×½ºÆ® Æ÷ÇÔ) ¢º Á÷¹« ÀÎÅÍºä ¢º ·¹ÆÛ·±½ºÃ¼Å© ¹× Á¾ÇÕ ÀÎÅÍºä ¢º ó¿ìÇùÀÇ ¢º ÃÖÁ¾ÇÕ°Ý

¡Ø ÀϺΠÁ÷¹«ÀÇ °æ¿ì ¼­·ùÀüÇü¿¡ Á÷¹«Å×½ºÆ®°¡ Æ÷Ç﵃ ¼ö ÀÖ½À´Ï´Ù.

¡Ø ÀüÇü ÀýÂ÷´Â ÀÏÁ¤ ¹× »óȲ¿¡ µû¶ó º¯µ¿µÉ ¼ö ÀÖÀ¸¸ç, ÀüÇüº° °á°ú¿¡ µû¶ó ÀýÂ÷(Ãß°¡ ÀÎÅÍºä µî)°¡ Ãß°¡µÉ ¼ö ÀÖ½À´Ï´Ù.

¡Ø Á¤ÇØÁø °á°ú ¹ßÇ¥ ÀÏÁ¤Àº ¾øÀ¸¸ç, Áö¿ø¼­ °ËÅä ÈÄ ¸éÁ¢ ÀÏÁ¤Àº ´ë»óÀÚ¿¡°Ô °³º°·Î ¾È³»µå¸± ¿¹Á¤ÀÔ´Ï´Ù.



[±Ù¹«Áö]

°æ±â ¼º³²½Ã ºÐ´ç±¸ ºÒÁ¤·Î 6 (±×¸°ÆÑÅ丮)

¡Ø ±Ù¹«Áö´Â ȸ»ç ³»ºÎ »çÁ¤¿¡ µû¶ó º¯µ¿µÉ ¼ö ÀÖ½À´Ï´Ù.



[±âŸ»çÇ×]

º» °ø°í´Â Áߺ¹Áö¿øÀÌ ºÒ°¡´ÉÇϸç, ±âÁøÇàÇÑ Æ÷Áö¼Ç¿¡ ´ëÇÑ ÀüÇüÀÌ ¸ðµÎ ¸¶¹«¸® µÇ¸é ´Ù¸¥ Æ÷Áö¼ÇÀ¸·Î Áö¿øÀÌ °¡´ÉÇÕ´Ï´Ù.

- ÇØ¿Ü ÃâÀå¿¡ °á°Ý »çÀ¯°¡ ¾ø´Â ºÐ¸¸ Áö¿ø °¡´ÉÇÕ´Ï´Ù.

- º´¿ª Àǹ«¸¦ ÇÊÇÑ ÀÚ È¤Àº ¸éÁ¦µÈ ÀÚ(³²¼ºÀÇ °æ¿ì)¿¡ ÇÑÇØ ÀÔ»çÁö¿øÀÌ °¡´ÉÇÕ´Ï´Ù.

- Áö¿ø¼­ »ó ÇãÀ§ ±âÀç°¡ Àְųª Á¦Ãâ ¼­·ù°¡ ÇãÀ§ÀÎ °æ¿ì ÇÕ°ÝÀÌ Ãë¼ÒµÉ ¼ö ÀÖ½À´Ï´Ù.

- Á¦ÃâµÈ Áö¿ø¼­´Â [My page- Áö¿øÇöȲ]¿¡¼­ È®ÀÎ °¡´ÉÇϸç, °ø°í ¸¶°¨ Àü±îÁö ȨÆäÀÌÁö¿¡¼­ ¼öÁ¤ ¹× Áö¿ø öȸ°¡ °¡´ÉÇÕ´Ï´Ù.

- º» °ø°í´Â ÀÎÀç ¼±¹ß ¿Ï·á ½Ã Á¶±â ¸¶°¨µÉ ¼ö ÀÖÀ¸¸ç, ÇÊ¿ä ½Ã ¸ðÁý ±â°£ÀÌ ¿¬ÀåµÉ ¼ö ÀÖ½À´Ï´Ù.

- ±¹°¡À¯°øÀÚ ¹× Àå¾ÖÀÎ µî Ãë¾÷º¸È£ ´ë»óÀÚ´Â °ü°è¹ý·É¿¡ µû¶ó ¿ì´ëÇÕ´Ï´Ù.

- ±¹°¡À¯°øÀÚÀÇ °¡»êÁ¡ ºÎ¿©¸¦ ¹Þ±â À§Çؼ­´Â º»ÀÎÀÌ 'Ãë¾÷Áö¿ø ´ë»óÀÚ Áõ¸í¼­'¸¦ ȸ»ç¿¡ Á¦ÃâÇØ¾ß ÇÕ´Ï´Ù.

- Á¦ÃâÇØÁֽŠÁö¿ø¼­ÀÇ °ËÅä °á°ú ¹ßÇ¥´Â Áö¿ø¼­¿¡ µî·ÏÇϽŠÀ̸ÞÀÏ·Î °³º° ¾È³»µå¸³´Ï´Ù.

- ÀÔ»ç ÈÄ 3°³¿ùÀÇ ¼ö½À ±â°£À» Àû¿ëÇÏ¸ç Æò°¡¿¡ µû¶ó ¼ö½À ±â°£ÀÌ ¿¬ÀåµÇ°Å³ª ä¿ëÀÌ Ãë¼ÒµÉ ¼ö ÀÖ½À´Ï´Ù.

- ¹®ÀÇ»çÇ×Àº NAVER Cloud ä¿ë ȨÆäÀÌÁö 1:1 ¹®ÀÇ·Î Á¢¼öÇØÁֽñ⠹ٶø´Ï´Ù.