Démarrage
Utilisez cette page pour un premier run reproductible en environ 5 minutes et vérifier que l'environnement est sain.
Prérequis: Python 3.11+, pip et GPU CUDA optionnel.
Commandes
Installer les dépendances:
Vérifier CUDA:
Démarrage rapide (preset de référence: tinyshakespeare + char + configs/base/base.toml):
python scripts/data/prepare_data.py --dataset tinyshakespeare --tokenizer char --output-format txt --output-dir data/processed
python train.py --config configs/base/base.toml --tokenizer char --max-iters 5000
python generate.py --checkpoint checkpoints/ckpt_last.pt --meta data/processed/meta.json --tokenizer char --prompt "To be"
Tip
Pour un smoke test strict de 5 minutes, lancez l'entraînement, attendez la première évaluation/checkpoint, puis stoppez et lancez la génération.
Fichiers de sortie / artefacts produits
data/processed/meta.jsondata/processed/train.txt,data/processed/val.txtcheckpoints/ckpt_last.ptcheckpoints/train_log.json
Checklist de succès
- Les logs affichent au moins deux lignes
train_losset une tendance à la baisse. - Un checkpoint existe dans
checkpoints/ckpt_last.pt. generate.pyretourne un texte non vide.
Erreurs fréquentes
ModuleNotFoundError: torch: voir Torch not installed.- CUDA attendu mais indisponible: voir CUDA not detected.
- Mauvais chemin de métadonnées: voir Meta path mismatch.
Warning
Gardez --checkpoint et --meta alignés sur le même run. Mélanger des fichiers de runs différents donne des résultats trompeurs.