Je suis juste en train d’explorer les modèles de langage locaux et je veux juste jouer un peu et apprendre des choses. Pour tout travail « réel », mon entreprise paie toutes les principales plateformes d’IA LLM, donc je n’en ai pas besoin pour la productivité.
Selon les recherches, il semblait que le AI MAX+ 395 128go serait l’option « facile » la plus adaptée pour exécuter tout ce dont j’ai besoin sans trop de problèmes.
Mais en regardant la vidéo comparant le 5060ti au 9060 sur la chaîne YouTube d’Alex Ziskind, il semble qu’il puisse y avoir des cas (comme ComfyUI) où AMD est encore trop instable.
Dois-je opter pour le AI MAX pour une grande mémoire ou le 5090 pour la stabilité ?
en tenant compte de votre budget – ai max pas de question – si vous faites simplement l’inférence, si vous faites le fine tuning utilisez cloud runpod etx
Je choisirais personnellement le 395, car presque toutes les laboratoires d’IA optent pour une architecture MoE à l’heure actuelle. Donc un grand RAM peut accomplir beaucoup même s’il n’est pas le plus rapide.
Mais il y a beaucoup de fans de GPU dédiés ici qui pourraient probablement faire un excellent argument pour le 5090.
Pour moi, cela se résume vraiment à la puissance, à la consommation, à la chaleur et au bruit. Cela me éloigne de la voie du GPU.
Pas adapté, mais vous pouvez ajouter un cas eGPU.
Propriétaire du 5090 ici, je pense qu’il est assez polyvalent et relativement facile à utiliser. Il exécute la vidéo WAN, Flux, les images Qwen, les LLM avec des quantifications dans la plage de 24 à 32 milliards de paramètres. Et pour tout ce qui dépasse cela, vous pouvez utiliser votre entreprise ? Alors achetez des choses qui ne se produiront pas sur le service de l’entreprise.
Ensuite, les jeux 😃
mon avis :
\-si vous voulez faire des entraînements, CUDA et … peut-être des jeux vidéo, optez pour le 5090
\-si vous voulez simplement exécuter un modèle local pour les tester ou les servir en continu 24/7, le Strix Halo est probablement une meilleure option, presque tous les meilleurs modèles open source récents sont des MoE et nécessitent beaucoup de mémoire RAM/VRAM (GLM 4.5 Air, GPT Oss 120b, certains Qwant de Qwen 235, Qwen 3 next, … fonctionneront mieux sur le Strix Halo que sur le 5090 + 128 Go de RAM). De plus, le Strix Halo est généralement une machine complète, alors qu’avec le 5090, vous devrez encore acheter le reste de l’ordinateur !
ajout : mon exemple personnel, j’ai un 4090 dans mon PC principal pour les jeux et j’ai fait quelques tests PyTorch/CUDA dessus, mais j’ai commandé une machine Strix Halo (le framework la livrera avant 2035, je veux y croire….) pour exécuter des modèles plus grands et plus performants localement. De plus, c’est bien plus efficace à long terme.
Qwen Qwant 😆
J’ai vraiment écrit ça lol.
si c’était seulement pour jouer et apprendre des choses sur les LLM, je pencherais vers le framework 128.
mais dès que tu mentionnes comfy, AMD est hors de question. prends le 5090 à la place.
mais dès que vous mentionnez confortable, AMD est hors de question.
Pourquoi ? J’exécute Comfy pour générer des images/vidéos/voix sur mon Max+ 395. Cela fonctionne.
les choses changent si rapidement dans cet espace. pouvez-vous partager quels modèles d’images/vidéos fonctionnent et lesquels ne fonctionnent pas ?
Si vous êtes intéressé par la génération d’images/vidéos, vous avez besoin du 5090. Cela sera lamentablement lent sur le CPU.
Si vous souhaitez simplement exécuter des modèles MoE de manière interactive, le AI 395 suffira.
Personnellement, je choisirais les deux. Vous pouvez en fait connecter un 5090 à un système AI 395. Ainsi, vous pouvez exécuter des LLM pour vos workflows de génération/amélioration de prompts tout en générant des vidéos et des images selon vos désirs.
Je ne pense pas que les personnes qui n’ont pas expérimenté de GPU Blackwell comprennent à quel point ils sont plus rapides pour les tâches d’images/vidéos. Même par rapport à un 4090, mes temps de traitement sont réduits de moitié.
Merci pour les retours, la préoccupation concernant la stabilité était que je ne connais pas tout ce que je voudrai faire, sauf jouer un peu avec les choses.
La chose que je ne veux pas faire, c’est gérer des plateformes instables. Je fais assez de débogage logiciel dans mon travail quotidien, je n’ai pas besoin d’en faire à la maison. Mais en fonction de certains retours, je suppose que la préoccupation est un peu exagérée.
J’ai une machine dédiée ou deux que je peux utiliser pour installer la carte graphique, mais aussi je m’efforce fortement de garder mes affaires de jeu séparées afin de ne pas entrer dans ce piège.
Je pense que la capacité à exécuter plus de modèles récents avec moins de limitations me pousse à choisir l’AI MAX+.
Je pourrai toujours acheter une carte graphique plus tard si je m’investis vraiment dans cela et si le Strix Halo devient un goulot d’étranglement.
Merci encore !