AMD AI GPU K6 BMv1Àº CPU ³»Àå ±×·¡ÇÈ Äھ Ȱ¿ëÇØ, Çѱ¹¾î¿¡ °ÇÑ ´Ù±¹¾î ´ëÇü ¾ð¾î ¸ðµ¨(LLM)À» ½±°Ô ½ÇÇàÇÒ ¼ö ÀÖ½À´Ï´Ù. °£´ÜÇÑ AI 꺿À» ºÎ´ã ¾øÀÌ ¼Õ½±°Ô ±¸ÃàÇÒ ¼ö ÀÖ½À´Ï´Ù.
Ollama, vLLM, KTransformers µîÀÇ ÇÁ·¹ÀÓ¿öÅ©¸¦ ±â¹ÝÀ¸·Î ´ë±Ô¸ð ¾ð¾î ¸ðµ¨(LLM)À» ½ÇÇàÇÒ ¼ö ÀÖ´Â ÃÖÀûÈµÈ »ç¾çÀ» Á¦¾ÈÇÕ´Ï´Ù.
DeepSeek-R1 671B¿Í °°Àº ÃÊ´ëÇü ¾ð¾î ¸ðµ¨µµ NVIDIA ÇÏÀÌ¿£µå Multi-GPU ȯ°æÀÌ ¾Æ´Ï¿©µµ ÇÕ¸®ÀûÀÎ ºñ¿ëÀ¸·Î ½ÇÇàÇÒ ¼ö ÀÖ½À´Ï´Ù.
APU, 8 Multi-GPU, 1TB Memory·Î ¼ÒÇüºÎÅÍ ÃÊ´ëÇü±îÁö LLMÀ» ½ÇÇàÇÒ ¼ö ÀÖ½À´Ï´Ù.
ÃֽŠNVIDIA µ¥ÀÌÅͼ¾ÅÍ¿ë VRAM 96GB GPU¸¦ Multi·Î ±¸¼ºÇÒ ¼ö ÀÖ´Â ½Ã½ºÅÛ È¯°æÀ» Á¦°øÇÕ´Ï´Ù.
ÇÁ·ÎÁ§Æ® ¸ñÇ¥ ¹× »ç¿ë ȯ°æÀ» °í·ÁÇÏ¿© ÇÁ·¹ÀÓ¿öÅ©¸¦ ¼±ÅÃÇØ¾ß ÇÕ´Ï´Ù. ½º¸¶Àϼºê´Â LLMÀ» ½ÇÇàÇÒ ¼ö ÀÖ´Â ÀÎÇÁ¶ó ÀÚ¿ø¿¡ °¡Àå ÃÖÀûÈµÈ ÇÁ·¹ÀÓ¿öÅ©¸¦ Á¦°øÇÕ´Ï´Ù.
VM ¶Ç´Â Àú»ç¾ç ¼¹ö¿¡¼ 4bit ¹× 8bit·Î ¾çÀÚÈµÈ ÁÖ¿ä ¿ÀǼҽº LLMÀ» °£¼ÒÈµÈ È¯°æ¿¡¼ ½ÇÇàÇÒ ¼ö ÀÖµµ·Ï ¼³°èµÈ °æ·® Ç÷§Æû
¸Þ¸ð¸® È¿À²¼º: °¡º±°í È®Àå °¡´ÉÇÑ ±¸Á¶·Î ¼³°èµÇ¾î, ´Ù¾çÇÑ ÄÄÇ»ÆÃ ȯ°æ¿¡¼ ·ÎÄà ÀÚ¿øÀ» È¿À²ÀûÀ¸·Î Ȱ¿ëÇÒ ¼ö ÀÖ½À´Ï´Ù.
Á÷°üÀû ÅëÇÕ: °£´ÜÇÑ API¿Í »çÀü ±¸ÃàµÈ ¸ðµ¨ ¶óÀ̺귯¸®¸¦ Á¦°øÇÏ¿©, º°µµÀÇ º¹ÀâÇÑ È¯°æ ¼³Á¤ ¾øÀÌ ¹Ù·Î ´ë±Ô¸ð ¾ð¾î ¸ðµ¨À» »ý¼º, ½ÇÇà, °ü¸®ÇÒ ¼ö ÀÖ½À´Ï´Ù.
·ÎÄà Áß½É È®À强: Ŭ¶ó¿ìµå ¼Ö·ç¼Ç¿¡ ÀÇÁ¸ÇÏÁö ¾Ê°í, »ç¿ëÀÚ°¡ Á÷Á¢ ¸ðµ¨ °¡ÁßÄ¡, ±¸¼º, µ¥ÀÌÅ͸¦ ÆÐŰ¡ ¹× Á¶Á¤ÇÒ ¼ö ÀÖÀ¸¸ç, GPU Ȱ¿ë ÃÖÀûÈ ¿É¼ÇÀ» Áö¿øÇÕ´Ï´Ù.
ÀÚÀ¯·Î¿î ¸ðµ¨ ¿î¿ë: Llama, Gemma µî ´Ù¾çÇÑ ´ëÇü ¾ð¾î ¸ðµ¨À» ·ÎÄà ȯ°æ¿¡¼ Á÷Á¢ ¿î¿ë¡¤Á¦¾îÇÏ¿© µ¥ÀÌÅÍ º¸¾È°ú ÇÁ¶óÀ̹ö½Ã¸¦ °ÈÇÒ ¼ö ÀÖ½À´Ï´Ù.
À¯¿¬ÇÑ ÀÎÇÁ¶ó ȣȯ: Mac, Windows, Linux µî ´Ù¾çÇÑ OS¿Í ȯ°æ¿¡¼ ÀϰüµÈ LLM ¼ºñ½º Á¦°øÀÌ °¡´ÉÇÕ´Ï´Ù.
°í¼º´É LLM ¼ºù ¹× Ãß·ÐÀ» Áö¿øÇÏ´Â ÇÁ·¹ÀÓ¿öÅ©·Î GPU ±â¹ÝÀÇ ºü¸¥ ÅäÅ« »ý¼º°ú È¿À²ÀûÀÎ ºÐ»ê ó¸® °¡´ÉÇÑ ÇÁ·¹ÀÓ¿öÅ©
¸Þ¸ð¸® È¿À²¼º : PagedAttention ±â¼úÀ» ±â¹ÝÀ¸·Î ´ë±Ô¸ð ¾ð¾î ¸ðµ¨¿¡¼ ¸Þ¸ð¸® »ç¿ëÀ» ÃÖÀûÈÇϰí ó¸® È¿À²À» ³ôÀÔ´Ï´Ù.
ºñµ¿±âÀû ½ÇÇà : ÀÔ·Â ¿äûÀ» ºñµ¿±âÀûÀ¸·Î ó¸®ÇÏ¿© GPUÀÇ È°¿ëµµ¸¦ ±Ø´ëÈÇϸç, µ¿½Ã¿¡ ¿©·¯ ÀÛ¾÷À» È¿À²ÀûÀ¸·Î ¼öÇàÇÒ ¼ö ÀÖ½À´Ï´Ù.
È®Àå ¹× È£È¯¼º : ´Ù¾çÇÑ Çϵå¿þ¾î ȯ°æ¿¡¼ ½ÇÇà °¡´ÉÇϸç, ¸ðµ¨ Å©±â¿Í µ¥ÀÌÅÍ ÀÔ·Â Å©±â¿¡ µû¶ó À¯¿¬ÇÏ°Ô È®Àå °¡´ÉÇÕ´Ï´Ù.
Nvidia GPU Áö¿ø : ¶Ù¾î³ ¼º´ÉÀÇ Nvidia GPU ¸ðµ¨°ú VRAMÀÇ °·ÂÇÑ ¼º´ÉÀ¸·Î °á°ú¹°À» ³ôÀÏ ¼ö ÀÖ½À´Ï´Ù.
°ü¸®ÀÚ ±ÇÇÑ Á¦°ø : vLLM¿¡¼ Á¦°øÇÏ´Â ´Ù¾çÇÑ LLMÀ» ¼³Ä¡ Á¦¾îÇÒ ¼ö ÀÖ´Â ±ÇÇÑÀ» ºÎ¿©ÇÕ´Ï´Ù.
´Ù¾çÇÑ ÀÎÇÁ¶ó ÀÚ¿ø Á¦°ø : VM, Baremetal¿¡¼ ½ÇÇàÇÏ¿© ÇÁ·ÎÁ§Æ® ¸ñÇ¥¿¡ µû¶ó Á¶ÀýÇÒ ¼ö ÀÖ½À´Ï´Ù.
DeepSeek-R1 671B¿Í °°Àº ÃÊ´ëÇü ¾ð¾î ¸ðµ¨À» ½ÇÇàÇÒ ¼ö ÀÖ´Â ºñ¿ë È¿À²¼º¿¡ ±Ø´ëÈµÈ ÇÁ·¹ÀÓ¿öÅ©
¸Þ¸ð¸® °ü¸®: Transformer ¸ðµ¨ÀÇ Å©°í º¹ÀâÇÑ ±¸Á¶¸¦ È¿À²ÀûÀ¸·Î ó¸®ÇÒ ¼ö ÀÖµµ·Ï ÇÙ½É ¿¬»ê(ƯÈ÷ Attention)ÀÇ ¸Þ¸ð¸® »ç¿ëÀ» ÃÖ¼ÒÈÇØ, º¸´Ù ÀûÀº ÀÚ¿øÀ¸·Îµµ °í¼º´É Ãß·ÐÀÌ °¡´ÉÇÕ´Ï´Ù.
½ÇÇà ¼Óµµ: PyTorch, CUDA¿ÍÀÇ ÃÖÀûÈµÈ ¿¬µ¿À» ÅëÇØ GPU¸¦ ÃÖ´ëÇÑ È°¿ëÇϸç, ±âÁ¸ Transformer ±¸Çö ´ëºñ ºü¸¥ ÅäÅ« »ý¼º°ú º´·Ä ó¸® È¿À²À» º¸ÀåÇÕ´Ï´Ù.
¸ðµâÈ/È®À强: LLM ¼ºù ÇÁ·¹ÀÓ¿öÅ©(vLLM, HuggingFace Transformers µî)¿ÍÀÇ È£È¯¼ºÀÌ ¶Ù¾î³ª, ´Ù¾çÇÑ ¸ðµ¨°ú ¾ÖÇø®ÄÉÀ̼ǿ¡ Áï½Ã Àû¿ëÀÌ °¡´ÉÇÕ´Ï´Ù.
GPU ¼º´É ±Ø´ëÈ: ÃֽŠNvidia GPUÀÇ ¿¬»ê ¼º´É°ú ´ë¿ë·® VRAMÀ» ÃÖ´ëÇÑ È°¿ëÇÒ ¼ö ÀÖ´Â ÃÖÀûÈµÈ Attention ¿¬»êÀ» Á¦°øÇÕ´Ï´Ù.
´ë±Ô¸ð Ãß·Ð Áö¿ø: º¹¼öÀÇ ÀÔ·Â µ¥ÀÌÅÍ¿¡ ´ëÇØ µ¿½Ã Ãß·Ð, ¹èÄ¡ ó¸® µî °í¼Ó ´ë·® 󸮰¡ ÇÊ¿äÇÑ ¼ºñ½º ȯ°æ¿¡ ÀûÇÕÇÕ´Ï´Ù.
¿ÀǼҽº ¹× À¯¿¬¼º: ÀÚÀ¯·Ó°Ô Ä¿½ºÅ͸¶ÀÌ¡ÀÌ °¡´ÉÇÑ ¿ÀÇ ¼Ò½º ¶óÀ̺귯¸®·Î, ÇÁ·ÎÁ§Æ® ¿ä±¸ »çÇ׿¡ ¸ÂÃç ¼¼¹ÐÇÑ ¼³Á¤°ú ¿¬µ¿ÀÌ °¡´ÉÇÕ´Ï´Ù.
LLM ½ÇÇà ½Ã CPU-GPU È¥ÇÕ »ç¿ëÀº È¿À²¼º Çâ»ó¿¡ ÇʼöÀûÀÔ´Ï´Ù. ¸ðµ¨ ±Ô¸ð¿Í Ãß·Ð ÇÁ·¹ÀÓ¿öÅ©¿¡ µû¶ó ÀûÀýÇÑ GPU ¹× ¸Þ¸ð¸® »ç¾çÀÌ ´Þ¶óÁö¸ç, ¾çÀÚÈ ¸ðµ¨ÀÇ °æ¿ì ¾Æ·¡ °¡À̵带 Âü°íÇϽñ⠹ٶø´Ï´Ù.
LLM ¸ðµ¨ | ¸Å°³º¯¼ö | URL(Çã±ëÆäÀ̽º) | ÄÁÅØ½ºÆ® ±æÀÌ(tokens) | ¼º´É(´É·Â) |
---|---|---|---|---|
gpt-oss | 20B |
Ollama Hugging Face |
128K |
- o3-miniº¸´Ù ¿ì¼öÇϸç o4-mini¿Í °ÅÀÇ µ¿µîÇÑ ¼öÁØÀÇ Ãß·Ð ´É·Â º¸À¯ - ¼öÇÐ, ÀÏ¹Ý ¹®Á¦Çذá, µµ±¸ È£Ã⠵¼ ¶Ù¾î³ ¼º´É ¹ßÈÖ - MMLU, HLE µî ¾ð¾î(ÀÌÇØ/Ãß·Ð/ÀÛ¹®) ´É·Â »óÀ§ ¼öÁØ |
120B |
Ollama Hugging Face |
|||
Qwen3 | 30B |
Ollama Hugging Face |
32K |
- Äڵ塤¼öÇС¤Ãß·Ð µî¿¡¼ »óÀ§ ¸ðµ¨º¸´Ù ¶Ù¾î³ MoE ¾ÆÅ°ÅØÃ³ Àû¿ë - 119°³ ±¹ ´Ù±¹¾î Áö¿ø ¸ðµ¨·Î½á Çѱ¹¾î ó¸® ¼º´É ¿ì¼ö - ºü¸¥ ´äº¯ ¼Óµµ¿Í Çâ»óµÈ ÄÚµå »ý¼º ´É·Â Á¦°ø |
32B |
Ollama Hugging Face |
|||
235B |
Ollama Hugging Face |
|||
DeepSeek-R1 | 7B |
Ollama Hugging Face |
128K |
- °è»ê, ÄÚµù, ÀÀ´ä ǰÁú µî GPT-4 ÀÌ»ó ¼öÁØÀÇ ¿ì¼öÇÑ ¼º´É - Áß±¹¾î ¹× ¿µ¾î¿¡ ´ÉÅë, ÁؼöÇÑ Çѱ¹¾î ÀÌÇØµµ ¹× ÀÀ´ä ¼º´É |
14B |
Ollama Hugging Face |
|||
70B |
Ollama Hugging Face |
|||
671B |
Ollama Hugging Face |
|||
Gemma3 | 12B |
Ollama Hugging Face |
input : 128K output : 8192 |
- °æ·®È ±â¹Ý ¸Þ¸ð¸® È¿À²¼º ¿ì¼ö - GPT-3.5 ±â¹ÝÀÇ ¾ÈÁ¤Àû ¼º´É - ´Ù±¹¾î Áö¿ø ¸ðµ¨·Î½á Çѱ¹¾î ó¸® ¼º´É ¿ì¼ö |
27B |
Ollama Hugging Face |
|||
Llama4 - Scout | 17B |
Ollama Hugging Face |
10M |
- ÃÖ´ë 10M ÅäÅ«ÀÇ ÃÊÀå±â ¹®¸Æ À¯Áö °¡´É - ±ä ¹®¼ ¿ä¾à, Áö¼Ó ´ëÈ ¼º´É, Äڵ庣À̽º ºÐ¼®¿¡ ƯÈ(Á¤¹Ð Ãß·Ð ¼º´ÉÀº ÀϹÝÀû) - ¿µ¾î Á᫐ ¼³°è, Çѱ¹¾î ¼º´É ´Ù¼Ò ³·À½ |
Llama3.3 | 70B |
Ollama Hugging Face |
128K |
-GPT-4 Turbo±Þ °í¼º´É Ãß·Ð ¹× ´ëÈ °¡´É - Ãß·Ð, ´ëÈ, ÄÚµù, Áö½Ä ÀÀ´ä ¼º´É ¿ì¼ö - ´Ù±¹¾î ÇнÀ ±â¹Ý ¸ðµ¨, Çѱ¹¾î ¼º´É Áؼö |
Llama3.2 | 11B |
Ollama Hugging Face |
128K |
- °æ·® ¸ðµ¨ ´ëºñ ¶Ù¾î³ ÄÚµù ó¸® ¼º´É ¹× ¿ì¼öÇÑ ¾ÈÁ¤¼º - ´Ù±¹¾î ÇнÀ ±â¹Ý ¸ðµ¨, Çѱ¹¾î ¼º´É ÀϺΠÇѰè Á¸Àç |
90B |
Ollama Hugging Face |
- GPT-4 Turbo±Þ ´ëÈ, Ãß·Ð, Áö½Ä ÀÀ´ä °¡´É - ´ë±Ô¸ð ÆÄ¶ó¹ÌÅÍ ±â¹ÝÀÇ ´Ù±¹¾î ÇнÀ, Çѱ¹¾î ´ëÀÀ·Â ¿ì¼ö |
||
Phi4 | 14B |
Ollama Hugging Face |
32K |
- ºü¸¥ ÀÀ´ä ¼Óµµ, GPT-3.5±Þ ³í¸® Ãß·Ð, ¿ä¾à °¡´É - °æ·®È¿¡ ÃÖÀûÈµÈ ¸ðµ¨ - Çѱ¹¾îÀÇ Á¤È®µµ, À¯Ã¢¼º ´Ù¼Ò ³·À½ |
HyperCLOVA X SEED | 1.5B |
Hugging Face |
16K |
- ¿Âµð¹ÙÀ̽º ¹× Àú»ç¾ç ȯ°æ¿¡ ÃÖÀûÈµÈ °æ·® ¸ðµ¨ - GPT-3.5 °è¿ ¼ÒÇü ¸ðµ¨ ¼öÁØÀÇ Á¤È®µµ ¹× ¾ÈÁ¤¼º - Çѱ¹¾î ±â¹Ý Áö½Ã¾î ¹× Áú¹® ÀÀ´ä ¼º´É ¸Å¿ì ¿ì¼ö |
3B |
Hugging Face |
¸ðµ¨ | ¸Å°³º¯¼ö | DRAM ÃÖ¼Ò »ç¾ç | ½ÇÇà ȯ°æ |
---|---|---|---|
ÃʼÒÇü | ~ 2B ÆÄ¶ó¹ÌÅÍ | 4 ~ 8GB | ³ëÆ®ºÏ ¼öÁØÀÇ GPU ¶Ç´Â ÀϺΠCPU-only ȯ°æ¿¡¼µµ ½ÇÇà °¡´É |
¼ÒÇü | 2B ~ 10B ÆÄ¶ó¹ÌÅÍ | 8 ~ 16GB | ÀÏ¹Ý ¼ÒºñÀÚ¿ë GPU °¡´É 4090 µî |
ÁßÇü | 10B ~ 20B ÆÄ¶ó¹ÌÅÍ | 16 ~ 32GB | 4000Ada ÀÌ»ó ¶Ç´Â RTX 4090/5090 Multi-GPU ±¸¼º |
´ëÇü | 20B ~ 70B ÆÄ¶ó¹ÌÅÍ | 32 ~ 128GB | A6000, PRO5000 Multi-GPU ±¸¼º |
ÃÊ´ëÇü | 70B ~ ÆÄ¶ó¹ÌÅÍ | 128GB ÀÌ»ó | PRO6000 Multi-GPU ±¸¼º ÀÌ»ó |
AI ±â¹ÝÀÇ ºÐ¼® ¹× ½Ã°¢È ¼ºñ½º¸¦ Á¦°øÇÏ´Â Artificial Analysis ¿¡¼ LLM¿¡ ´ëÇÑ ´õ ´Ù¾çÇÑ ÀڷḦ Âü°íÇÒ ¼ö ÀÖ½À´Ï´Ù. (ÇØ´ç »çÀÌÆ®´Â Á¤º¸ Á¦°øÀ» ¸ñÀûÀ¸·Î °øÀ¯Çϸç, ½º¸¶Àϼºê¿Í´Â ¹«°üÇÕ´Ï´Ù.)
½º¸¶Àϼºê´Â ÇÕ¸®ÀûÀÎ °¡°ÝÀÇ GPU ¼¹ö¸¦ ÅëÇØ »ç¿ëÀÚ°¡ ¿øÇϴ ȯ°æ¿¡¼ ÇÊ¿äÇÑ ¼ºñ½º¸¦ À¯¿¬ÇÏ°Ô ±¸µ¿ÇÒ ¼ö ÀÖµµ·Ï Áö¿øÇÕ´Ï´Ù.
»ç¿ëÀÚ´Â GPU Pass-through·Î ÇÒ´çµÇ´Â °¡»ó ¼¹ö, Áï½Ã Ȱ¿ë °¡´ÉÇÑ ¿Âµð¸Çµå º£¾î¸ÞÅ» ¼¹ö,
¿øÇÏ´Â »ç¾çÀ¸·Î Á÷Á¢ ±¸¼ºÇÏ´Â ¸ÂÃãÇü GPU ¼¹ö Áß ¼±ÅÃÇÏ¿© ÀÚ½ÅÀÇ ¿ëµµ¿Í ¿¹»ê¿¡ ÃÖÀûÈµÈ ÀÎÇÁ¶ó ÀÚ¿øÀ» ÀÚÀ¯·Ó°Ô ¼±ÅÃÇÒ ¼ö ÀÖ½À´Ï´Ù.
CLOUDV¿¡¼ Á¦°øÇÏ´Â AMD GPU ±â¹Ý Ollama Æ¯È º£¾î¸ÞÅ» ¼¹ö´Â °í¹Ðµµ ÁýÀûÀ» À§ÇÑ Àü¿ë ÆûÆÑÅÍ¿Í ÇÕ¸®ÀûÀÎ ¿ù ¿ä±ÝÁ¦·Î °í¼º´É LLM ȯ°æÀ» Á¦°øÇÕ´Ï´Ù.
»óǰ¸í | AMD AI GPU K6 BMv1 | AMD AI 9060XT BMv1 | AMD AI W6800 BMv1 |
---|---|---|---|
GPU Type | AMD APU | 9060XT (Stream Processors: 2,048) |
W6800 (Stream Processors: 3,840) |
GPU | 1 | 1 | 1 |
VRAM | Custom | 16GB (GDDR6) |
32GB (GDDR6) |
CPU(Thread) | 16 Thread | 16 Thread | 16 Thread |
DRAM | 32GB | 64GB | 64GB |
Storage(OS) | 512GB SSD | 500GB SSD | 500GB SSD |
³×Æ®¿öÅ© ¼Óµµ | 1Gbps | ||
(Àüü) ¿ù 2,400GByte ±âº» Á¦°ø, Ãʰú 1GB´ç 70¿ø (ÇØ¿Ü) ¿ù 50GByte ±âº» Á¦°ø, Ãʰú 100MB´ç 40¿ø |
|||
Áö¿ø ÇÁ·¹ÀÓ¿öÅ© | Ollama | Ollama | Ollama |
ÀÌ¿ë·á(¿ù) | 75,000¿ø | 149,000¿ø | 199,000¿ø |
GPU¼¹ö ±¸¸Å°¡ ºÎ´ãµÇ°Å³ª GPU ¼º´É È®ÀÎ ¹× Å×½ºÆ®°¡ ÇÊ¿äÇÒ °æ¿ì iwinv GPU °¡»ó ¼¹ö¸¦ ÀÌ¿ëÇϼ¼¿ä. GPU Á¾·ù¿¡ µû¶ó ÃÖ´ë 4°³±îÁö °¡»óÈµÈ È¯°æ¿¡¼ ÇÒ´ç(PassThrough)ÇÑ ¼¹ö¸¦ ÀÏ ¿ä±ÝÀ¸·Î ÀÌ¿ëÇÒ ¼ö ÀÖ½À´Ï´Ù.
GPU ¸ðµ¨ | Tesla T4 | 4000Ada | A6000 | PRO5000 | PRO6000 |
---|---|---|---|---|---|
GPU °³¼ö | 1 ~ 4 GPU | ||||
vCPU | 6 ~ 24 vCPU | 8 ~ 32 vCPU | 8 ~ 32 vCPU | 8 ~ 32 vCPU | 8 ~ 32 vCPU |
DRAM | 60 ~ 240GB | 120~480GB | |||
VRAM | 16 ~ 64GB | 20 ~ 80GB | 48 ~ 192GB | 48 ~ 192GB | 96 ~ 384GB |
Storage(OS) | SSD 100GB | ||||
AI ÇÁ·¹ÀÓ¿öÅ© |
LLM: Ollama, vLLM AI/ML: TensorFlow, PyTorch µî |
||||
ÀÌ¿ë·á(ÀÏ) | 6,260¿ø ~ | 9,200¿ø ~ | 18,200¿ø ~ | ÁغñÁß | 51,480¿ø ~ |
LLM ¼¹ö ¼º´ÉÀº »ç¿ë ¸ñÀû¿¡ ¸Â´Â »ç¾ç ¼³Á¤¿¡ µû¶ó ´Þ¶óÁý´Ï´Ù. GPU´Â º´·Ä ¿¬»ê, CPU´Â ¸ðµ¨ °ü¸® ¹× µ¥ÀÌÅÍ Ã³¸®, RAMÀº ´ë¿ë·® ó¸®, Storage´Â µ¥ÀÌÅÍ ÀúÀå ¹× I/O ¼Óµµ¿¡ °¢°¢ ±â¿©ÇÕ´Ï´Ù. LLM ¸ðµ¨ÀÇ ±Ô¸ð, ¸ñÀû, ¿¹»ê¿¡ ¸ÂÃç ¼±ÅÃÇÒ ¼ö ÀÖ½À´Ï´Ù.
GPU´Â LLM 󸮿¡¼ °¡Àå Áß¿äÇÑ ¿ä¼Ò Áß Çϳª·Î, ´ë±Ô¸ð º´·Ä ¿¬»êÀ» ¼öÇàÇÕ´Ï´Ù.
- GPU ¸Þ¸ð¸® ¿ë·® (VRAM): ´ë±Ô¸ð ¾ð¾î ¸ðµ¨ÀÇ °æ¿ì ¸ðµ¨ Å©±â°¡ ¸Å¿ì Å©±â ¶§¹®¿¡ GPUÀÇ VRAM ¿ë·®ÀÌ ÃæºÐÈ÷ Ä¿¾ß ÇÕ´Ï´Ù.
- FP16/FP32 ¿¬»ê ¼Óµµ : AI ÀÛ¾÷¿¡¼ ÁÖ·Î »ç¿ëµÇ´Â FP16(half-precision) ¿¬»ê ¼Óµµ°¡ ³ôÀº GPU¸¦ ¼±ÅÃÇØ¾ß ÇÕ´Ï´Ù.
- ´ÙÁß GPU Áö¿ø ¿©ºÎ : ´ëÇü ¸ðµ¨Àº ±âº»ÀûÀ¸·Î ¸ÖƼ GPU ±¸¼ºÀÌ ÇÊ¿äÇÕ´Ï´Ù.
CPU´Â Àüü ½Ã½ºÅÛÀÇ Á¦¾î¿Í µ¥ÀÌÅÍ Àüó¸® ¹× ¸ðµ¨ °ü¸®¸¦ ´ã´çÇÕ´Ï´Ù.
- ÄÚ¾î ¼ö: CPU ÄÚ¾î´Â º´·Ä µ¥ÀÌÅÍ ·Îµù ¹× ¸ðµ¨ ½ºÄÉÁÙ¸µÀ» ó¸®ÇϹǷΠ¸ÖƼÄÚ¾î ÇÁ·Î¼¼¼°¡ À¯¸®ÇÕ´Ï´Ù.
- Ŭ·° ¼Óµµ : ³ôÀº Ŭ·° ¼Óµµ´Â ºü¸¥ µ¥ÀÌÅÍ Áغñ¿Í ¸ðµ¨ ½ÇÇà ¼Óµµ¸¦ Áö¿øÇÕ´Ï´Ù.
RAMÀº ¸ðµ¨ ½ÇÇà ¹× µ¥ÀÌÅÍ Ã³¸® ½Ã Àӽà µ¥ÀÌÅ͸¦ ÀúÀåÇÏ´Â ¿ªÇÒÀ» ÇÕ´Ï´Ù.
- ¿ë·®: RAMÀº GPU ¸Þ¸ð¸®ÀÇ ÇѰ踦 º¸¿ÏÇÏ´Â ¿ªÇÒÀ» ÇÕ´Ï´Ù. µû¶ó¼ ÃæºÐÇÑ RAM ¿ë·®ÀÌ Áß¿äÇÕ´Ï´Ù.
- ¼Óµµ (Ŭ·°) : RAM Ŭ·° ¼Óµµ°¡ ºü¸¦¼ö·Ï µ¥ÀÌÅÍ Ã³¸® ¼Óµµ°¡ Çâ»óµË´Ï´Ù. DDR4 ¶Ç´Â ÃֽŠDDR5 ¸Þ¸ð¸®¸¦ ÃßõÇÕ´Ï´Ù.
- ¸Þ¸ð¸® È®À强 : ¼¹öÀÇ RAM ½½·Ô ¼ö¸¦ È®ÀÎÇÏ¿© ÇÊ¿ä ¿ë·®À» °è»êÇÒ ¼ö ÀÖ½À´Ï´Ù.
Storage´Â LLM ÀÛ¾÷¿¡¼´Â ¸ðµ¨ ÀúÀå ¹× µ¥ÀÌÅÍ I/O ¼º´ÉÀÌ Áß¿äÇÕ´Ï´Ù.
- ¼Óµµ: °í¼Ó µ¥ÀÌÅÍ ÀÔÃâ·ÂÀ» À§ÇØ NVMe SSD¸¦ ÃßõÇÕ´Ï´Ù.
- ÀÔÃâ·Â ÀÛ¾÷ ¼ö : ´ë±Ô¸ð µ¥ÀÌÅͼÂÀ» ºü¸£°Ô ºÒ·¯¿À±â À§ÇØ IOPS(ÃÊ´ç ÀÔ·Â/Ãâ·Â ÀÛ¾÷ ¼ö)°¡ ³ôÀº SSD¸¦ ÃßõÇÕ´Ï´Ù.
- ¿ë·® : 1~2TB ÀÌ»óÀÇ ¿ë·®À» ±ÇÀåÇÕ´Ï´Ù.
Áö¿ø ¹üÀ§ | Ollama, vLLM(4GPU) | Ollama, vLLM(8GPU) | Ktransformers |
---|---|---|---|
GPU ½½·Ô | ÃÖ´ë 4°³ | ÃÖ´ë 8°³ | ÃÖ´ë 1°³ |
GPU ¸ðµ¨ |
- AMD : w6800, 9700 - NVIDIA : 4000Ada, A6000, 6000Ada PRO5000, PRO6000, 4090 blower |
- AMD : w6800, 9700 - NVIDIA : 4000Ada, A6000, 6000ada, PRO5000, PRO6000, 4090 blower |
- NVIDIA : 4000Ada, A6000, 6000Ada, PRO5000, PRO6000, 4090 blower, 5080, 5090 |
CPU | 1 x Xeon Silver 4314 (16C/32T) |
2 x Xeon Silver 4314 (32C/64T) |
2 x Xeon Silver 4510 (24C/48T) |
RAM | 8 x 16~64GB (DDR4) |
32 x 16~64GB (DDR4) |
16 x 64GB (DDR5) |
Storage |
SSD, NVMe - ³»ºÎ: 2 x PCIe3.0 x2, 1 x SATA3(2.5") - ¿ÜºÎ: 8 x SATA3(2.5"/3.5") Hot-swap |
SSD, NVMe - ³»ºÎ: 1 x PCIe3.0 x4 - ¿ÜºÎ: 12 x SATA3(2.5"/3.5") Hot-swap |
SSD, NVMe - ³»ºÎ: 2 x PCIe4.0 x2, 1 x SATA3(2.5") - ¿ÜºÎ: 8 x SATA3(2.5"/3.5") Hot-swap |
LAN |
- 4 x 2.5Gbps(RJ45, Ethernet Àü¿ë) - 1 x IPMI Àü¿ë(RJ45) - ÃÖ´ë 2port 10Gbps NIC ÀåÂø °¡´É (3GPU ÀÌÇÏ ½Ã) |
- 2 x 1Gbps(RJ45, Ethernet Àü¿ë) - 1 x IPMI Àü¿ë(RJ45) - ÃÖ´ë 2port 10Gbps NIC ÀåÂø °¡´É |
- 2 x 1Gbps(RJ45, Ethernet, 1x IPMI °øÀ¯) - 1 x IPMI Àü¿ë(RJ45) - ÃÖ´ë 2port 10Gbps NIC ÀåÂø °¡´É |
Chassis | SMILE Barebone4U | Tyan GPU B7129F83AV8E4HR-N-HE | SMILE Barebone4U |
PSU | ATX [2000/2500]W Single | - 6000W(3+1 2,000W RPSU, 80+ Platinum) - 4800W(3+1 1,600W RPSU, 80+ Platinum) |
ATX 1200W Single |
Á¦Á¶»ç | NVIDIA | AMD | |||||
---|---|---|---|---|---|---|---|
¸ðµ¨ | PRO6000 | PRO5000 | Tesla T4 | A6000 | 4000Ada | RX9060XT | W6800 |
¾ÆÅ°ÅØÃÄ | Blackwell | Blackwell | Turing | Ampere | Ada Lovelace | AMD RDNA¢â 4 | AMD RDNA¢â 2 |
GPU ¸Þ¸ð¸® | 96GB (GDDR7 ECC) |
48GB (GDDR7 ECC) |
16GB (GDDR6 ECC) |
48GB (GDDR6 ECC) |
20GB (GDDR6 ECC) |
16GB (GDDR6) |
32GB (GDDR6 ECC) |
GPU ¸Þ¸ð¸® ´ë¿ªÆø | 1,792 GB/s | 1,344 GB/s | 320 GB/S | 768 GB/S | 360 GB/S | 320 GB/s | 512 GB/S |
CUDA ÄÚ¾î (½ºÆ®¸²ÇÁ·Î¼¼¼) |
24,064 | 14,080 | 2,560 | 10,752 | 6,144 | 2,048 | 3,840 |
FP32 ¼º´É | 110 TFLOPS | 73.2 TFLOPS | 8.1 TFLOPS | 38.7 TFLOPS | 26.7 TFLOPS | 25.6 TFLOPs | 17.83 TFLOPS |
TDP | 300W | 300W | 70W | 300W | 130W | 160W | 250W |
º» ÆäÀÌÁö´Â AI Ã߷РȰ¿ë¿¡ ´ëÇÑ È¯°æ Á¤º¸¸¦ Á¦°øÇϹǷÎ, GPU ¼¹ö¿¡ ´ëÇÑ ÀÚ¼¼ÇÑ »çÇ×Àº °¢ »óǰ ÆäÀÌÁö¿¡¼ È®ÀÎÇÒ ¼ö ÀÖ½À´Ï´Ù.
º» ÆäÀÌÁö¿¡ Ç¥½ÃµÈ Á¤º¸´Â ½ÇÁ¦ Á¤º¸¸¦ È®ÀÎÇÒ ¼ö ÀÖ´Â »óǰ ÆäÀÌÁöÀÇ ³»¿ë°ú »óÀÌÇÒ ¼ö ÀÖÀ¸¸ç, ½ÇÁ¦ ¼ºñ½º°¡ °¡´ÉÇÑ ÆäÀÌÁöÀÇ Á¤Ã¥À» ¿ì¼±À¸·Î ÇÕ´Ï´Ù.
±âŸ À̿뿡 °üÇÑ »çÇ×Àº ¾à°ü ¹× SLA¿¡¼ È®ÀÎÇϽñ⠹ٶø´Ï´Ù.
1. º£¾î¸ÞÅ»
¨ç »óǰ À̿뿡 ´ëÇÑ »ó¼¼ Á¤º¸ ¹× Á¤Ã¥Àº ¿µ±¸ÀÓ´ë-¿Âµð¸Çµå¿¡¼ È®ÀÎÇÒ ¼ö ÀÖ½À´Ï´Ù.
2. ¸ÂÃã¼¹ö
¨ç ¸ÂÃã ¼¹ö´Â »ó´ã > °ßÀû > ³³Ç° ¼øÀ¸·Î ÁøÇàÇϸç, ÀÌ °úÁ¤¿¡¼ ¼ºñ½º ÀÌ¿ë±îÁö ½Ã°£ÀÌ ¼Ò¿äµÉ ¼ö ÀÖ½À´Ï´Ù.
¨è ½º¸¶Àϼºê IDC ¿Ü ¼³Ä¡ Àå¼Ò´Â ½º¸¶Àϼºê Çù·Â»ç¸¦ ÅëÇÏ¿© ³³Ç°À» ³³Ç°µÇ¹Ç·Î ÃâÀåºñ°¡ ¹ß»ýÇÕ´Ï´Ù.
¨é ¸ÂÃã ¼¹ö´Â °ßÀû ´ç½Ã ±âÁØÀ¸·Î °ø±Þ°¡°¡ °áÁ¤µÇ¸ç, °ßÀû À¯È¿ ±â°£ ¶Ç´Â °ø°ø ¿ä±Ý Àλó µîÀÇ ÀÌÀ¯·Î º¯°æ µÉ ¼ö ÀÖ½À´Ï´Ù.
3. °¡»ó¼¹ö
¨ç °¡»ó¼¹ö¿¡ °üÇÑ ¸ðµç »ç¾çÀº iwinv ȨÆäÀÌÁö¿¡¼ È®ÀÎ °¡´ÉÇÕ´Ï´Ù..