Трава - Революция данных

12/9/2024, 8:36:14 AM
Grass дает моделям и приложениям искусственного интеллекта доступ ко всему Интернету в качестве набора данных, который собирается с помощью сети узлов по всему миру, которые вносят свой простаивающий Интернет-полосу. У них есть сильное начальное притяжение более чем 2,5 миллиона пользователей.

Executive Summary

Генеративное искусственное интеллект - самое важное достижение в последнее время и становится еще более важным по мере того, как идет время. Генеративный искусственный интеллект в основном представляет собой продукт трех элементов:

Алгоритмы + Данные + Вычисления = Интеллект

Это означает, что данные и вычисления, скорее всего, станут двумя самыми важными активами в мире, и доступ к ним будет чрезвычайно важным.

Generative AI-модели требуют множество данных. Данные, на которых работают самые значимые Generative AI-модели, представляют собой сумму данных Интернета, что является приближением к общей сумме человеческих знаний.

Криптовалюта - это возможность получить доступ к новым цифровым ресурсам по всему миру и превратить в активы то, что раньше ими не являлось, с помощью токенов. Grass делает это для данных.

Grass дает моделям и приложениям искусственного интеллекта доступ ко всему Интернету в качестве набора данных, живых, которые собираются через сеть узлов по всему миру, которые вносят свой неиспользуемый интернет-трафик. У них есть сильное начальное притяжение более чем у 2,5 миллионов пользователей.[1]

Долгосрочный потенциальный рынок для Grass огромен и пропорционален размеру рынка искусственного интеллекта и его будущему росту. В прошлом сбор наборов данных такого масштаба был доступен только крупнейшим технологическим гигантам. Grass вносит новую экономику в область данных, снижая затраты. Это демократизирует доступ к данным, обеспечивая не только крупные элитные компании, но и более малые предприятия в сфере искусственного интеллекта.

Проблема

Обучение и настройка искусственного интеллекта требуют огромных объемов данных. Исторически большая часть этих данных была собрана создателями моделей искусственного интеллекта, скрывающих данные с веб-сайтов. Процесс скрапинга имеет ряд сложностей:

  • Веб-скрапинг затратен. Есть только пара крупных организаций, способных периодически скрэпить весь веб. Это исключает меньших разработчиков искусственного интеллекта от доступа к данным.
  • Блокировка IP-адреса. Между службами сбора информации и создателями контента ведется настоящая игра в кошки-мышки. Довольно просто заблокировать IP-адрес, чтобы прекратить сбор информации, что затрудняет достижение целей сбора информации и сбор необходимых данных для обучения и настройки искусственного интеллекта.
  • Нерациональное использование ресурсов. Сбор информации с Интернета - задача, которая может быть полезна многим клиентам. Однако использование аппаратного обеспечения, пропускной способности и вычислительной мощности для этого неэффективно, если она выполняется одним клиентом.
  • Свежесть данных. Сканирование всего Интернета является трудоемким и дорогостоящим процессом. Это делает его непрактичным для большинства пользователей, что делает данные менее свежими/актуальными и влияет на качество моделей искусственного интеллекта.

Решение Grass

Grass стремится решить эти проблемы, создав федерированную сеть веб-скрейперов. Каждый участник, принимающий участие в сети Grass, вносит свою долю неиспользуемой интернет-пропускной способности, чтобы обеспечить небольшое количество скрейпинга с его IP-адреса. Затем Grass собирает данные с каждого из этих узлов, чтобы сформировать объединенный набор данных, полезный для обучения и настройки искусственного интеллекта. Это элегантное и подходящее использование распределенных сетей, снабженных криптовалютой.

Есть и другие деловые случаи использования неиспользуемого Интернета, такие как:

  • Сбор местных/географических данных, таких как реклама
  • Проведение академических исследований
  • Проверка местных цен

Сегодня Grass собирает данные, используя существующее оборудование (ноутбуки, настольные компьютеры и т. д.). В будущем Grass планирует предложить устройство для сбора данных, являющееся специализированным аппаратным устройством, полностью посвященным сбору данных, что позволит повысить эффективность, так как аппаратное обеспечение оптимизировано для этой конкретной задачи.

Преимущества травы

Существует несколько преимуществ использования распределенной сети для сбора данных:

  • Демократизированный доступ к веб-данным, который становится дешевле при масштабировании. Вместо того, чтобы единственный клиент собирал данные для своих собственных нужд, Grass собирает данные от имени многих клиентов. Эти данные могут быть перепроданы несколько раз, создавая экономию масштаба на данных, снижая экономические затраты на скрейпинг и делая рынок более эффективным. При масштабировании Grass может, гипотетически, стать наиболее экономичным решением для сбора данных для клиентов, создавая экономический эффект сетевого взаимодействия вокруг своего протокола. Это означает, что сбор данных теперь доступен каждому, а не только нескольким большим компаниям, которые имеют ресурсы для скрейпинга веб-сайтов.
  • Блокировка IP становится невозможной. Распределение скрапинга делает его намного сложнее обнаружить и остановить, поскольку каждый узел выполняет лишь относительно небольшой объем захвата данных и трудно отличить от типичного интернет-трафика. Это приводит к более полным наборам данных для обучения.
  • Интернет-трафик используется более эффективно. Поскольку Grass эффективно использует неиспользуемый интернет-трафик, это более эффективно, чем предоставление нового трафика только для скрэппинга.
  • Данные более точные и актуальные. Становится экономически целесообразным скрейпить их чаще, чем это мог бы сделать обычный клиент. В результате это приводит к тому, что данные становятся менее устаревшими. Это важно, поскольку модели искусственного интеллекта, полученные в результате, более актуальны.

The Challenge: Создатели контента, монетизирующие свои данные

Одной из сложностей при сборе данных является взаимодействие с создателями контента. Это включает такие сайты, как NY Times и Reddit, которые начали монетизировать свои данные, предоставляя лицензии третьим лицам для обучения моделей искусственного интеллекта. Естественно, они защищают данные на своих сайтах, поскольку эти данные представляют собой очень прибыльные источники дохода для них. Действительно, Reddit запретил использование его разработчиками API для машинного обучения, чтобы защитить свою бизнес-модель предоставления лицензий на использование своих данных моделям искусственного интеллекта (см. условия предоставления услуг).здесь).

Что ждет создателей контента в будущем? Подумайте о том, что для пользовательского контента (UGC), такого как Reddit, есть аргумент, что пользователи владеют своими данными (а не платформа), поскольку контент создан пользователями и должен принадлежать им. Этот аргумент еще не был полностью изучен с юридической точки зрения. Будет интересно следить за этим впереди. Однако, если пользователи действительно владеют своими внесенными данными, то Grass может представлять гипотетический путь помощи этим пользователям в монетизации их собственных внесенных данных. Например, Grass может вознаградить самих участников Reddit за то, что они добровольно вносят свои данные, которые они создали на Reddit.

Для платных создателей контента, таких как NY Times, контент создается оплаченными писателями, и поэтому нет аргументов в пользу данных, принадлежащих пользователю. Таким образом, Grass может просто исключить эти сайты из сканирования. В качестве альтернативы Grass может масштабироваться до того уровня, когда станет возможным для самого Grass стать клиентом этих сайтов и платить лицензионные сборы. Теоретически это могло бы работать так, что клиенты Grass могли бы платить за данные, а затем Grass могло бы делиться доходами с создателями контента, тем самым обеспечивая создание моделей искусственного интеллекта в рамках гибкого бюджета. В качестве альтернативы Grass могло бы достичь такого масштаба, что оно могло бы договориться о массовом лицензионном соглашении от имени всех своих клиентов.

Запуск Grass

У Grаss в начале этого года был очень впечатляющий запуск:

  • У травы был самый широко распространенный воздушный заброс в истории Соланы.[2]
  • Более 2 миллионов кошельковзаявленопроведение эйрдропа привело к перегрузке сети Solana.
  • По всему миру число пользователей Grass превышает 2,5 миллиона.[3]
  • У Grass уже есть возможности и данные для обучения модели ChatGPT 3.5 от OpenAI.
  • В качестве демонстрации своей платформы Grass опубликовал набор данных, состоящий из 600 миллионов сообщений и комментариев с Reddit за 2024 год (см. здесьдля объявления издесьдля набора данных).

На момент написания токен Grass имелпозитивная ценовая динамикапост-запуск (+115%), что необычно, так как большинство токенов падают в дни/недели после листинга. Вероятно, это отражение их умного подхода к распределению эйрдропа, а также веры в будущее и потенциал Grass. В целом, это отличный старт для сети, и мы считаем, что он проложит путь к многим процветающим годам впереди.

Производительность токена Grass с момента запуска 28 октября 2024 года

Источник: TradingView.

Начните вносить вкладподключив свой кошелек Solana и заработав токен Grass.

Хотите использовать наборы данных Grass для вашего бизнеса, исследований или проекта? Свяжитесь с командой на Gate.iodiscover@grassfoundation.io.

Сноски

[1] Источник: https://www.getgrass.io/.
[2] Source: https://www.google.com/url?q=https://www.theblock.co/post/323805/grass-becomes-most-distributed-solana-airdrop-as-nearly-1-5-million-addresses-claim-tokens&sa=D&source=docs&ust=1732646335082707&usg=AOvVaw0oVvhJL661rmE1ABmJqOyP.
[3] Source: https://www.getgrass.io/.

Отказ от ответственности:

  1. Эта статья взята из [Hack VC], Все авторские права принадлежат оригинальному автору [Ed Roman]. Если есть возражения по поводу этого переиздания, пожалуйста, свяжитесь с Gate Learnкоманда и они оперативно займутся этим.
  2. Отказ от ответственности: Взгляды и мнения, выраженные в этой статье, являются исключительно мнениями автора и не являются инвестиционными советами.
  3. Переводы статьи на другие языки выполняются командой gate Learn. Если не указано иное, копирование, распространение или плагиат переведенных статей запрещено.

Пригласить больше голосов

Крипто-календарь

Обновления проекта
Etherex запустит токен REX 6 августа.
REX
22.27%
2025-08-06
Запуск продукта NFT AI
Nuls запустит продукт NFT AI в третьем квартале.
NULS
2.77%
2025-08-06
Запуск dValueChain v.1.0
Bio Protocol планирует запустить dValueChain v.1.0 в первом квартале. Цель заключается в создании децентрализованной сети медицинских данных, обеспечивающей безопасные, прозрачные и защищенные от подделки медицинские записи в экосистеме DeSci.
BIO
-2.47%
2025-08-06
Субтитры для видео, созданные ИИ
Verasity добавит функцию автоматической генерации субтитров для видео с использованием ИИ в четвертом квартале.
VRA
-1.44%
2025-08-06
Многоязычная поддержка VeraPlayer
Verasity добавит многопользовательскую поддержку в VeraPlayer в четвертом квартале.
VRA
-1.44%
2025-08-06

Похожие статьи

Что такое OpenLayer? Все, что вам нужно знать о OpenLayer
Средний

Что такое OpenLayer? Все, что вам нужно знать о OpenLayer

OpenLayer - это взаимодействующий слой данных ИИ, разработанный для модернизации потоков данных в цифровых экосистемах. Он может использоваться для бизнеса и обучения моделей искусственного интеллекта.
2/7/2025, 2:57:43 AM
Что такое Telegram NFT?
Средний

Что такое Telegram NFT?

В этой статье обсуждается превращение Telegram в приложение, работающее на основе NFT, интегрирующее технологию блокчейна для революционизации цифрового дарения и владения. Узнайте основные возможности, возможности для художников и создателей, и будущее цифровых взаимодействий с NFT от Telegram.
1/10/2025, 1:41:40 AM
Что такое AIXBT от Virtuals? Все, что вам нужно знать об AIXBT
Средний

Что такое AIXBT от Virtuals? Все, что вам нужно знать об AIXBT

AIXBT от Virtuals - это криптопроект, объединяющий блокчейн, искусственный интеллект и большие данные с криптотрендами и ценами.
1/7/2025, 6:18:13 AM
Обзор Топ-10 мем-монет ИИ
Средний

Обзор Топ-10 мем-монет ИИ

Мем с искусственным интеллектом — это развивающаяся область, которая сочетает в себе искусственный интеллект, технологию блокчейн и культуру мемов, обусловленную рыночным интересом к креативным токенам и тенденциями, возглавляемыми сообществом. В будущем сектор мемов с искусственным интеллектом может продолжить развиваться с внедрением новых технологий и концепций. Несмотря на текущие активные рыночные показатели, топ-10 проектов могут существенно колебаться или даже меняться из-за изменений в настроениях сообщества.
11/29/2024, 7:04:45 AM
Как определить и отслеживать умные деньги в криптовалюте
Новичок

Как определить и отслеживать умные деньги в криптовалюте

Эта статья исследует, как инвестировать, отслеживая умные деньги на рынке криптовалют. Умные деньги обычно относятся к участникам рынка с выдающимися результатами, такими как китовые кошельки, обычные кошельки с высокими победными ставками в транзакциях и т. д. В этой статье предоставляются несколько шагов для идентификации и отслеживания этих кошельков.
7/24/2024, 8:49:42 AM
Рост и перспективы криптовалют следующего поколения на основе искусственного интеллекта
Средний

Рост и перспективы криптовалют следующего поколения на основе искусственного интеллекта

AI Agents готовы принести инновации и рост в крипто-пространство. В этой статье рассматриваются ключевые тенденции, включая эволюцию текстовых мульти-модальных AI Agents, рост автономных торговых агентов, таких как AIXBT, и потенциал интеллекта стаи. Также рассматриваются экономические модели, определяющие захват ценности токенов и будущее развитие Crypto+AI фреймворков.
12/31/2024, 4:14:35 PM
Начните торговать сейчас
Зарегистрируйтесь сейчас и получите ваучер на
$100
!