Dépannage
Utilisez cette page pour diagnostiquer rapidement les erreurs fréquentes de setup, de données et d'exécution. Toutes les ancres ci-dessous sont référencées depuis les pages des guides.
Installation
Torch non installé
Symptômes: ModuleNotFoundError: torch, ou échec des scripts à l'import.
Correctif:
Utilisez le sélecteur officiel si vous avez besoin d'un build CUDA spécifique: https://pytorch.org/get-started/locally/
CUDA non détecté
Symptômes: torch.cuda.is_available() retourne False, ou fallback CPU dans les scripts.
Vérification rapide:
Points à vérifier:
- Driver NVIDIA installé et à jour
- Build PyTorch compatible avec votre runtime CUDA
- Même environnement Python utilisé pour l'installation et l'exécution
Données et métadonnées
Chemin des métadonnées incohérent
Symptômes: génération/entraînement incorrects ou impossibles à charger via les métadonnées tokenizer.
Mapping attendu:
- Pipeline
txt->data/processed/meta.json - Pipeline
bin->data/meta.json
Shards binaires introuvables
Symptômes: Binary shards not found avec training.data_format = "bin".
Correctif:
python scripts/data/prepare_data.py --dataset tinyshakespeare --tokenizer char --output-format bin --output-dir data/processed
Vocabulaire char manquant
Symptômes: Char tokenizer requires vocab in meta.json.
Correctif:
python scripts/data/prepare_data.py --dataset tinyshakespeare --tokenizer char --output-format txt --output-dir data/processed
Puis passez le --meta data/processed/meta.json correspondant aux commandes de génération/export.
Exécution
Mémoire insuffisante
Réduire dans cet ordre:
training.batch_sizemodel.block_sizetraining.gradient_accumulation_steps- Taille du modèle / complexité du preset
FlashAttention indisponible
LabCore applique des fallbacks automatiques:
- FlashAttention (priorité, si disponible)
- Fallback SDPA PyTorch
- Fallback attention causale standard
Problèmes de chemin et de policy Windows
- Activez le venv avant les commandes.
- Lancez les commandes depuis la racine du repo.
- Citez les chemins si des espaces sont présents.
- Si la policy PowerShell bloque les scripts, utilisez les commandes
python ...directement.
Windows : erreur PermissionError de pytest dans %TEMP%
Sous Windows, pytest peut échouer avec une PermissionError en utilisant le dossier temporaire par défaut (%TEMP%). Cela peut arriver lorsqu'un autre processus (par exemple l'antivirus) garde un fichier ouvert. Solution : exécuter pytest avec un dossier temporaire local :
Ce dépôt configure aussi --basetemp=.pytest_tmp par défaut dans pyproject.toml.