Le plus grand moment de base de l'IA

3/31/2025, 7:48:09 AM
Intermédiaire
IA
Les monopoles de données sont arrivés et affament les petits. En même temps, la qualité du web ouvert est en chute libre - les informations sont délibérément empoisonnées et les bêtises générées par l'IA polluent le corpus.

Le plus grand obstacle de l'IA n'est pas la conception du modèle ou les GPU - c'est les données. Et en ce moment, ces données sont verrouillées et brouillées. Les grandes plateformes Web2 (Reddit, X, Google, etc.) gardent jalousement leurs informations derrière des murs payants ou des CGU strictes. Les monopoles de données sont arrivés, et ils affament les petits acteurs. En même temps, la qualité du web ouvert est en chute libre - les informations sont délibérément empoisonnées et les futilités générées par l'IA polluent le corpus. C'est la tempête parfaite: l'IA a besoin de données, mais le puits est gardé et contaminé.

*Voir la version complète de "Le plus grand moment de base de l'IA" surPortail de recherche des Quatre Piliers

1. Le pari contraire de Grass : décentraliser le grattoir, tokeniser le pipeline

Entrer @getgrass_io, un protocole de web scraping décentralisé qui renverse ce script. Pensez à des millions d'appareils quotidiens (PC maintenant, téléphones bientôt) agissant comme de mini-web crawlers, raclant l'internet 24/7 à la recherche de données publiques. Grass transforme le contenu web brut en ensembles de données structurées prêtes pour l'IA, et le fait via l'économie cryptographique : les utilisateurs gagnent des récompenses pour contribuer à la bande passante et au calcul. C'est comme un minage web participatif, mais pour l'information au lieu du Bitcoin.

2. La Swarm Is Already Alive

L’herbe est déjà en service à grande échelle. Plus de 3 millions de nœuds dans le monde sont connectés au réseau, et ils récupèrent collectivement plus de 1 500 To de données par jour. En utilisant d’innombrables adresses IP résidentielles, Grass peut collecter des données à partir de sites sans déclencher les alarmes anti-scraping habituelles (plus besoin d’être banni d’IP pour avoir trop exploré). Il s’agit essentiellement de remplacer les fermes de données centralisées géantes par un essaim d'« abeilles de données » individuelles – plus difficiles à balayer et faciles à mettre à l’échelle.

Pourquoi cela importe-t-il? Parce que cela ouvre les monopoles de données. Au lieu que quelques gros acteurs stockent des données ou facturent des frais absurdes, toute startup en IA ou chercheur peut accéder au flux de données de Grass. Imaginez extraire le contenu de Reddit ou Twitter pour votre modèle d'IA sans avoir à mendier un accès API ou à débourser des millions - Grass rend cela plausible. C'est l'alternative sans permission pour l'ère de l'IA: si les données sont le nouveau pétrole, Grass construit un réseau de plates-formes pétrolières décentralisées où tout le monde peut forer.

3. Vérification des données via des preuves ZK

Le contrôle de la qualité est l'autre moitié de l'équation, et Grass a une réponse astucieuse: des preuves de connaissance zéro et une vérification sur chaîne. Chaque donnée récupérée peut être estampillée d'une preuve cryptographique (un ZK-SNARK) attestant de son origine et de son intégrité, enregistrée sur la propre blockchain de Grass (un rollup souverain qu'ils construisent à cet effet). En termes simples: vous obtenez un reçu pour chaque extrait web indiquant "cela provient de la Source X à l'heure Y et n'a pas été altéré." C'est énorme pour lutter contre l'empoisonnement des données et les déchets. Lorsque le pipeline est vérifiable, vous pouvez filtrer les données suspectes ou corrompues - ou du moins retracer les problèmes après coup. Dans un monde où l'IA pourrait accidentellement s'entraîner sur des ordures générées par l'IA, disposer d'un tampon d'authenticité pour les données est un changement de jeu.

4. Mise à l'échelle vers des pétabits par jour et au-delà

Parlons de la pile technologique : Grass a commencé sur Solana (pour la vitesse), mais même Solana ne peut pas gérer le volume ici. Ainsi, l'équipe envisage de déployer un rollup souverain (pensez-y comme leur propre blockchain L2) pour gérer le débit important d'une chaîne principale, tout en ancrant toujours la confiance sur une couche de base.

Ils appellent la mise à niveau majeure actuelle Sion, et elle frappe déjà comme un train de marchandises. Grass gère maintenant plus de 1 500 To de données par jour - non pas comme un objectif, mais comme une mesure en direct. Sion (Phases 1 & 2) a suralimenté le réseau, débloquant un débit échelonné en pétaoctets et permettant le grattage multimodal en temps réel : pas seulement du texte, mais aussi des images et des vidéos, en streaming à grande échelle. Fondamentalement, Grass est passé d'un régime alimentaire textuel à un buffet à volonté de données web. Pour les experts en IA qui pensent au-delà du texte (bonjour les modèles de vision, GPT-4, etc.), c'est une grande affaire.

5. Comment $GRASS alimente le volant d'inertie

Maintenant, comment Grass incite-t-il ce réseau tentaculaire? Entrez dans l'économie des jetons. En ce moment, les utilisateurs gagnent des "points Grass" pour exécuter des nœuds - essentiellement un espace réservé pour la vraie chose. Un véritable $GRASSjeton est à l'horizon, et c'est là que la crypto rencontre l'économie de l'IA. L'utilité du jeton liera tout le système ensemble: les entreprises d'IA ou les chercheurs dépenseront$GRASSdemander des données (comme payer par appel API, mais décentralisé), et les opérateurs de noeuds gagneront$GRASSpour répondre à ces demandes (récupération et livraison de données). Les validateurs du réseau vont probablement miser des jetons pour garantir un comportement honnête et une livraison de données de haute qualité (les mauvais acteurs pourraient être réduits, les bons acteurs récompensés). En bref, $GRASSvas graisser les rouages, en alignant les incitations entre les consommateurs de données et les fournisseurs.

6. Infra décentralisée avec un vrai PMF

De manière cruciale, l'approche de Grass atténue quelques problèmes existentiels dans l'IA :

  • Inégalité d'accès aux données : Aujourd'hui, seuls les Googles et OpenAIs peuvent parcourir l'ensemble du web (et même eux se font poursuivre en justice ou bloquer). Grass niveau le terrain de jeu en rendant les données à l'échelle du web accessibles à quiconque peut payer un peu de jeton - une barrière beaucoup plus basse.
  • Qualité des données et empoisonnement : Grâce aux preuves on-chain et (éventuellement) à la validation communautaire, il est beaucoup plus difficile pour quelqu'un d'introduire des données toxiques dans un ensemble d'entraînement sans être remarqué. Grass peut signaler ou exclure du contenu qui ne correspond pas à son empreinte on-chain. Avec le temps, la nature distribuée du réseau pourrait même aider à identifier du contenu généré par l'IA et l'empêcher de renforcer la boucle (imaginez filtrer les articles d'actualité qui ne sont que des sorties de ChatGPT).
  • Résistance à la censure : parce que Gate fonctionne via des milliers de nœuds indépendants, aucun interrupteur unique ne peut couper le flux d'informations. C'est l'effet Streisand rencontre la blockchain - essayez de bloquer les données ici, et elles contournent simplement. Pour les développeurs IA, cela signifie des pipelines plus robustes.

7. Final Alpha: Ne construisez pas des boîtes noires, construisez une IA de base

Pour être clair, Grass en est encore à ses débuts. Il est en version bêta, certaines parties sont encore centralisées (il y a actuellement un coordinateur central, qui sera décentralisé plus tard), et le stockage/nettoyage des données est côté client pour le moment. Mais la trajectoire est définie. Le réseau explose en taille (atteignant des niveaux record en termes de nœuds et de volume de données cette année), et chaque mise à niveau (comme Sion) le rapproche d'un protocole pleinement opérationnel et autoportant.

La vision est audacieuse: Grass veut être la couche de données pour l'IA décentralisée. Imaginez un marché ouvert où n'importe qui peut obtenir des données d'entraînement de haute qualité à la demande, avec une confiance cryptographique intégrée. Pas de gardiens, pas de loyers géants payés à Reddit ou Google, et moins de soucis concernant l'effondrement des modèles à force de se mordre la queue. C'est un torrent de données pour l'IA détenu par la communauté et sécurisé par la cryptographie.

Dans un monde crypto avide de réelle utilité, Grass se démarque comme un projet fusionnant deux méga-tendances (IA & DePIN) avec un produit réel dans la nature. Il est conscient des memes par son nom mais sérieux dans son exécution. Si elle réussit, Grass pourrait transformer le paysage de l'IA - transformant le web lui-même en une source de données vivante et respirante ouverte à tous. Pour les VC, les constructeurs et les lurkers de Crypto Twitter, gardez un œil sur celui-ci. Ce n'est pas souvent que l'on voit une nouvelle couche d'infrastructure internet être construite en temps réel, alimentée par un jeton et un rêve d'information fluide.

Avertissement :

  1. Cet article est repris de [Ponyo : : FP]. Tous les droits d'auteur appartiennent à l'auteur original [Ponyo : : FP]. Si des objections sont soulevées concernant cette reproduction, veuillez contacter le Gate Learnéquipe, et ils s'en occuperont rapidement.
  2. Responsabilité de non-responsabilité : Les points de vue et opinions exprimés dans cet article sont uniquement ceux de l'auteur et ne constituent aucun conseil en investissement.
  3. L'équipe Gate Learn effectue des traductions de l'article dans d'autres langues. Copier, distribuer ou plagier les articles traduits est interdit sauf mention contraire.

Partager

Calendrier Crypto

Mises à Jour du Projet
Etherex lancera le jeton REX le 6 août.
REX
22.27%
2025-08-06
Lancement de produit NFT AI
Nuls lancera un produit NFT AI au troisième trimestre.
NULS
2.77%
2025-08-06
Lancement de dValueChain v.1.0
Bio Protocol est sur le point de lancer dValueChain v.1.0 au cours du premier trimestre. Il vise à établir un réseau de données de santé décentralisé, garantissant des dossiers médicaux sécurisés, transparents et infalsifiables au sein de l'écosystème DeSci.
BIO
-2.47%
2025-08-06
Sous-titres vidéo générés par IA
Verasity ajoutera une fonction de sous-titres vidéo générés par l'IA au quatrième trimestre.
VRA
-1.44%
2025-08-06
Support multilingue de VeraPlayer
Verasity ajoutera le support multilingue à VeraPlayer au quatrième trimestre.
VRA
-1.44%
2025-08-06

Articles connexes

Qu'est-ce que Tars AI? Explorer le futur de l'IA et de l'intégration Web3
Avancé

Qu'est-ce que Tars AI? Explorer le futur de l'IA et de l'intégration Web3

Découvrez comment Tars AI comble le fossé entre l'IA et Web3, offrant des solutions évolutives et des outils innovants pour les applications décentralisées. Apprenez-en davantage sur ses principales fonctionnalités, ses avantages et son fonctionnement.
9/22/2024, 1:16:18 PM
Qu'est-ce que les récits Crypto? Top récits pour 2025 (MISE À JOUR)
Débutant

Qu'est-ce que les récits Crypto? Top récits pour 2025 (MISE À JOUR)

Memecoins, jetons de repos liquides, dérivés de mise liquide, modularité de la blockchain, Layer 1s, Layer 2s (rollups optimistes et rollups à connaissance nulle), BRC-20, DePIN, robots de trading crypto Telegram, marchés de prédiction et RWAs sont quelques récits à surveiller en 2024.
11/26/2024, 1:38:16 AM
Tout ce que vous devez savoir sur GT-Protocole
Débutant

Tout ce que vous devez savoir sur GT-Protocole

GT Protocol est l'un des produits d'IA les plus médiatisés de 2024, utilisant une technologie d'IA avancée pour créer des outils de trading d'IA uniques. Il peut être utilisé pour la gestion de portefeuille d'IA, le trading d'IA et les méthodes d'investissement dans les marchés CeFi, DeFi et NFT, aidant les gens à découvrir facilement et à investir dans diverses opportunités Web3. Il a attiré des centaines de millions d'utilisateurs à participer.
9/25/2024, 7:10:21 AM
Inventaire de 12 projets d'IA sur le sous-réseau Bittensor
Intermédiaire

Inventaire de 12 projets d'IA sur le sous-réseau Bittensor

Bien que l'engouement autour de l'IA ne soit pas aussi fort qu'au début de l'année, le fort rebond de Bittensor montre la confiance du marché dans les projets phares de ce secteur. L'ajout de 12 nouveaux sous-réseaux au cours des derniers mois a considérablement stimulé le développement de l'IA et pourrait favoriser de nouveaux projets innovants. Tout en étant attentif au rebond des prix du TAO, il convient également de tenir compte du développement et du potentiel de ses fondamentaux.
8/20/2024, 9:18:10 AM
Comprendre Hyberbolic: la plateforme d'IA en libre accès
Intermédiaire

Comprendre Hyberbolic: la plateforme d'IA en libre accès

Hyperbolic est une plateforme d'IA innovante en libre accès offrant des ressources de calcul rentables et des services d'IA grâce à son marché de GPU décentralisé et à sa technologie de pointe. La plateforme permet l'inférence d'IA, la location de GPU et la monétisation de modèles d'IA, ce qui facilite la prise de départ des chercheurs, des entreprises et des développeurs tout en optimisant les coûts. Grâce à son architecture avancée utilisant la preuve d'échantillonnage (PoSP) et la technologie spML, les utilisateurs peuvent exécuter des tâches de calcul de manière sécurisée et efficace. De débutants à professionnels, Hyperbolic offre des outils puissants et des ressources pour aider les utilisateurs à explorer et à faire progresser la technologie de l'IA.
1/10/2025, 2:07:14 AM
Vana: Un projet d'IA soutenu par les trois géants du VC
Intermédiaire

Vana: Un projet d'IA soutenu par les trois géants du VC

Vana est une start-up Web3 axée sur la construction d’un réseau de pool de données appartenant aux utilisateurs, en s’attaquant au problème de l’insuffisance des données d’entraînement pour les modèles d’IA grâce à la technologie blockchain. Il offre également aux internautes la possibilité de gagner de l’argent. Récemment, Vana a annoncé l’achèvement d’un tour de financement stratégique de 5 millions de dollars mené par Coinbase Ventures, portant son financement total à 25 millions de dollars. Vana prévoit d’établir un réseau DAO qui permettra aux membres de contribuer et de vendre des ensembles de données aux chercheurs en IA, favorisant ainsi le développement d’un écosystème d’IA décentralisé.
9/25/2024, 10:20:40 AM
Lancez-vous
Inscrivez-vous et obtenez un bon de
100$
!