RdGP@rdgp

423 heulier·ez

Heuliañ

21 Mae 2026

@rdgp Hypothèse 1 : si l'inefficacité énergétique et les besoins en calcul restent constants, le modèle est intenable.Plus d'utilisateurs = plus de coûts = marge qui se dégrade. Impossible de rentabiliser par la seule croissance de la base client.

cyrilht @cyrilht@podcastindex.social

21 Mae 2026

@rdgp Hypothèse 2 (plus probable) : les modèles deviendront moins gourmands pour les tâches courantes.La course aux nouveaux modèles a laissé de côté les optimisations. La recherche pousse fort dans cette direction. Quelques exemples 👇

Respont da @cyrilht

cyrilht@cyrilht@podcastindex.social

21 Mae 2026

@rdgp Compression (quantification 4/8 bits, pruning) : diviser la conso par 2-3 avec une perte de perf marginale.Calcul fédéré / distribution local-central : alléger les datacenters, lisser la charge.Frameworks « high throughput » : maximiser les tokens traités par unité de temps.