1. Tester en ligne de commande
Commencez avec la CLI. C’est le moyen le plus rapide de vérifier que tout fonctionne.Options utiles
| Option | À quoi elle sert |
|---|---|
--model | Choisir le modèle Hugging Face ou un dossier local |
--prompt | Fournir la demande à exécuter |
--max-tokens | Limiter la longueur de la réponse |
--temp | Rendre la génération plus stable ou plus créative |
2. Passer en mode chat
Si vous voulez conserver le contexte entre plusieurs messages, utilisezmlx_lm.chat :
- tester plusieurs prompts sans recharger le modèle
- comparer le comportement d’un modèle
- simuler une conversation avant de l’intégrer dans une app
3. Utiliser mlx-lm en Python
Quand la CLI devient trop limitée, passez à l’API Python :
Avec un modèle de type chat
Pour les modèles instruction ou chat, appliquez le template du tokenizer :4. Choisir un premier modèle raisonnable
Pour débuter, ne cherchez pas “le meilleur modèle” dans l’absolu. Choisissez un modèle qui rentre confortablement dans la mémoire de votre machine.3B ou 4B instruct
Idéal pour valider un setup, écrire des scripts et faire des tests rapides.
7B instruct
Bon compromis pour un usage général sur une machine avec un peu plus de marge.
Modèles plus grands
À réserver aux machines avec beaucoup de mémoire unifiée et à des besoins réels.
Versions 4-bit
Le meilleur point de départ dans la plupart des cas.
5. Convertir un modèle Hugging Face en format MLX
Si le modèle qui vous intéresse n’existe pas déjà côtémlx-community, vous pouvez le convertir :
mlx_lm.generate.
6. Exposer un serveur local compatible API
Si votre app Swift, votre frontend ou un autre outil doit parler à un modèle local via HTTP, lancez le serveur intégré :La bonne suite selon votre objectif
- Si vous voulez comparer plusieurs backends locaux, allez vers LLMs locaux sur Mac.
- Si vous voulez fine-tuner un modèle, commencez par LoRA.
- Si vous voulez intégrer un modèle dans une app Swift, lisez Intégration Swift.
Étape suivante : LLMs locaux sur Mac
Comparer MLX, Ollama, llama.cpp et les options Swift.