±¹³»´ë±â¾÷
¾÷¹«: ÀÚü Pre-Trained LLMÀ» °¡Áö°í Supervised Fine-TuningºÎÅÍ RLHF/RLAIF, DPO µîÀÇ Cutting-EdgeÇÑ Alignment
±â¼úÀ» Àû¿ëÇÏ¿© ´ëÈÇü ¾ð¾î¸ðµ¨À» °³¹ß
- Alignment Tuning ±â¼ú (Human/AI Feedback) ±â¹Ý ´ëÈÇü ¾ð¾î¸ðµ¨ °³¹ß
- µµ¸ÞÀÎ Æ¯È ´ëÈÇü ¾ð¾î ¸ðµ¨ °³¹ß
- Data Augmentation, Automatic Evaluation ±â¼ú ¿¬±¸/°³¹ß
- µ¥ÀÌÅÍ ¼³°è/È®Àå/Á¤Á¦, ¸ðµ¨ ÇнÀ/Æò°¡ ÇÁ·Î¼¼½º ¹Ýº¹À» ÅëÇÑ Áö¼ÓÀûÀÎ ¸ðµ¨ ¼º´É °íµµÈ
[ÀÚ°Ý¿ä°Ç]
- ±¹³»¿Ü ´ëÇÐÁ¹¾÷ ¹× ¼®»ç ÀÌ»ó ( AIºÐ¾ß ¹Ú»ç ÇÐÀ§ ¼ÒÁöÀÚ (¾ð¾î¸ðµ¨ Àü°ø) ¿ì´ë)
- ´ëÈÇü ¾ð¾î¸ðµ¨/¼ºñ½º »ó¿ë °³¹ß °æÇè 3³â ÀÌ»ó
- µö·¯´× ±â¹Ý ¾ð¾î ó¸®, ¾ð¾î/´ëÈ ¸ðµ¨ °ü·Ã ¿¬±¸/°³¹ß °æÇè º¸À¯
- ML ¾Ë°í¸®Áò ¹× µö·¯´× ±â¹Ý ¾ð¾î¸ðµ¨¿¡ ´ëÇÑ ½ÉÃþ Áö½Ä ¹× °³¹ß ¿ª·® º¸À¯
- ÃֽŠML ¹æ¹ý·ÐÀ» ºü¸£°Ô ½ÀµæÇÏ°í PrototypingÇÏ¿© ºÐ¼®ÇÒ ¼ö ÀÖ´Â ¿ª·® º¸À¯
- ´Ù¾çÇÑ Task Á¤ÀÇ¿¡ µû¶ó ¾ð¾î¸ðµ¨ÀÇ Fine-Tuning ¹æ¹ýÀ» ¼³°èÇÏ°í ±¸ÇöÇÒ ¼ö ÀÖ´Â ¿ª·® º¸À¯
- Multi-GPU, Multi-Node ȯ°æ¿¡¼ÀÇ ¾ð¾î ¸ðµ¨ ÃÖÀûÈ ¹× ºÐ»êÇнÀ ±â¼ú/°æÇè ¿ì´ë
- NLP/ML/DL °ü·Ã ÁÖ¿ä ÇÐȸ ³í¹® ½ÇÀû º¸À¯ ¿ì´ë
[Á¦Ãâ¼·ù]
À̷¼¿¡ ¿¬¶ôó, ÇöÀ翬ºÀ, Èñ¸Á¿¬ºÀ ±âÀç
Á¦ÃâÇÑ ¼·ù´Â ÀÏü ¹ÝȯÇÏÁö ¾ÊÀ½
±¹¹®À̷¼
[ÀüÇü¹æ¹ý]
¼·ùÀüÇü, ¸éÁ¢ÀüÇü
´ã´çÀÚ : Tim ÀÌ»ç (Pincus Korea)
¹®ÀÇó : ***-****-****
À̸ÞÀÏ : ******@*******.***