根据需求进行选配,选配方向,主要为个人使用,用途主要为生产力,AI、深度学习、AE、PR、PS、达芬奇等,不玩游戏,核心在于AI。
原文: A Full Hardware Guide to Deep Learning - Tim Dettmers 以这个为参考选配硬件
【译文】 A Full Hardware Guide to Deep Learning - Tim Dettmers
GPU 显卡
深度学习最重要的核心,能更好就更好,考虑性价比的话,下图推荐路线;对于4090的选配,不同厂商质量不一致,但是所有的散热都是溢出的,无论是旗舰还是丐版,性能影响都不大。然后选择了一个相对比较便宜的 4090 显卡,希望不要踩雷吧。
CPU
1少于4个 GPU 时, PCIE 通道与深度学习性能基本无关
CPU 一般只在两个方面,第一是启动 GPU 函数调用,第二个是执行 CPU 函数
CPU 最主要的功能应该是数据预处理与读取数据用,这只在边训练边预处理的方法中比较有用(建议每个 GPU 对应CPU4线程,2内核)
CPU 不用太好,但频率高的 CPU 确实能够提升一点性能以及一些使用体验。
所以根本不需要太好,95%的性能浪费
RAM 内存
内存时钟频率不影响任何深度学习性能
内存大小只影响 GPU 代码执行的舒适度,尽量与显卡匹配,比如显存24G内存就买大于24G
如果经常使用大型数据集,则更多 RAM 会很有用。
硬盘与固态硬盘
用于数据的硬盘驱动器(>=3TB)
使用 NVMeSSD 舒适地预处理小型数据集。(大概意思就是要训练的数据放在 SSD 上,平时的数据放在大硬盘上)
写代码的要异步加载小批量数据以避免增加时间。电源将 GPU + CPU 的瓦特相加。然后将所需瓦数的总数乘以110%。
冷却
冷却很重要,温度超标之后 GPU 或者 CPU 都会通过降低性能来控制温度,
使用空气冷却(看他的意思是如果是单卡,放着冷却就足够了)
如果您购买多个 GPU ,请购买带有"鼓风机式"风扇的 GPU
结论
基于以上,
CPU :不用太好最低要求:核心数大于 GPU 数量*2,线程数量大于 GPU 数量*4,可直接保留现有CPU,后期有需要在升级 CPU
GPU :直接上4090 OC
内存:尽量大,一定要比 GPU 的显存大(便宜),4090显存是24G,干脆直接上了64
固态:比内存稍贵一点,用来放训练时的数据即可,目前固态是500G,先将就用,后期有大批量数据的时候,在进行升级。
主板:目前主板不能使用4090显卡,所以更换主板,同步也需要更新内存
电源:目前电源是850w,所以需要升级
以下为最终配置以及入手价格
类型 | 配件名称 | 入手价格 | 备注 |
CPU | 【现有】英特尔(Intel) i7-12700F 12代 酷睿 处理器线程12核20线程 | ||
主板 | 华硕 ROG STRIX Z790-A GAMING WIFI S吹雪 | 2910 | |
内存 | 光威神策 32g *2 ddr5 6400 台式机内存条RGB灯条 | 1358 | |
SSD固态 | 【现有】阿斯加特(Asgard)500GB SSD固态硬盘M.2接口 | ||
显卡 | 耕升RTX 4090 炫光 OC 24G | ||
电源 | SUPER FLOWER振华 额定1300W LEADEXVI 1300W金牌全模 ATX3.0电源 | 1253 | |
散热器 | 瓦尔基里GL360 | 660 | |
机箱 | 王嘉罗宾 *7 | 269 | |
硬盘 | 12T 硬盘 | 【现有】 | |
显示器 | LG 2K显示器 DP HDMI | 【现有】 |