Dữ liệu của tôi không phải là của tôi: Sự xuất hiện của các lớp dữ liệu

2/10/2025, 4:24:36 AM
Trung cấp
Bảo mật
Thảo luận về quyền sở hữu dữ liệu và quyền riêng tư đã trở nên căng thẳng. Các giao thức dữ liệu Web3 như Vana, Ocean Protocol và Masa đang nổi lên, thúc đẩy chủ quyền dữ liệu phi tập trung và cho phép người dùng kiểm soát và tiếp cận dữ liệu của mình, đặc biệt là trong việc đào tạo trí tuệ nhân tạo và thu thập dữ liệu thời gian thực. Những giao thức này cung cấp các giải pháp mới cho việc giao dịch dữ liệu và bảo vệ quyền riêng tư, đáp ứng nhu cầu ngày càng tăng về dữ liệu chất lượng cao.

Dữ liệu là vàng kỹ thuật số trong thời đại mà sự chú ý diễn ra trực tuyến. Thời gian màn hình trung bình toàn cầu vào năm 2024 đạt 6 giờ 40 phút mỗi ngày, tăng so với các năm trước. Ở Hoa Kỳ, thời gian trung bình còn cao hơn, là 7 giờ 3 phút mỗi ngày.

Với mức độ tương tác này, lượng dữ liệu được tạo ra là đáng kinh ngạc - 328,77 triệu terabyte được tạo ra mỗi ngày vào năm 2024. Đó là khoảng 0,4 zetabyte (ZB) mỗi ngày khi xem xét tất cả dữ liệu mới được tạo ra, chụp, sao chép hoặc tiêu thụ.

Tuy nhiên, mặc dù lượng dữ liệu lớn đang được sản xuất và tiêu thụ hàng ngày, người dùng sở hữu rất ít dữ liệu:

  • Mạng xã hội: Dữ liệu trên các nền tảng như Twitter, Instagram và các nền tảng khác được kiểm soát bởi các công ty, mặc dù người dùng tạo ra nó.
  • Internet of Things (IoT): Dữ liệu từ các thiết bị thông minh thường thuộc về nhà sản xuất hoặc nhà cung cấp dịch vụ trừ khi có thỏa thuận cụ thể khác.
  • Dữ liệu sức khỏe: Trong khi cá nhân có quyền kiểm soát hồ sơ y tế của mình, một phần lớn dữ liệu từ ứng dụng sức khỏe hoặc thiết bị đeo được điều khiển bởi các công ty cung cấp dịch vụ đó.

Dữ liệu Crypto và Xã hội

Trong lĩnh vực tiền mã hóa, chúng ta đã chứng kiến sự bùng nổ của@_kaitoai, được lập chỉ mục dữ liệu xã hội trên Twitter và chuyển đổi nó thành dữ liệu tình cảm có thể hành động cho các dự án, KOLs và những nhà lãnh đạo suy nghĩ. Các từ “yap” và “mindshare” đã trở nên phổ biến nhờ chuyên môn hacking tăng trưởng của đội ngũ Kaito (với các bảng điều khiển mindshare & yapper phổ biến của họ) và khả năng thu hút sự quan tâm tự nhiên trên Crypto Twitter.

“Yap” nhằm thúc đẩy việc tạo ra nội dung chất lượng trên Twitter, nhưng vẫn còn nhiều câu hỏi chưa được trả lời:

  • Yaps được chấm điểm "chính xác" như thế nào?
  • Bạn có nhận được yap bổ sung khi nhắc đến Kaito không?
  • Kaito thực sự đề cao nội dung chất lượng, hay chỉ ưa chuộng những quan điểm gây tranh cãi nổi bật?

Bên cạnh dữ liệu xã hội, các cuộc thảo luận về quyền sở hữu dữ liệu, quyền riêng tư và tính minh bạch đang trở nên căng thẳng. Với sự tiến bộ nhanh chóng của trí tuệ nhân tạo, xuất hiện những câu hỏi mới: Ai sở hữu dữ liệu được sử dụng để huấn luyện các mô hình trí tuệ nhân tạo? Ai được hưởng lợi từ các kết quả được tạo ra bởi trí tuệ nhân tạo?

Những câu hỏi này đã đặt nền tảng cho sự gia tăng của các lớp dữ liệu Web3 - một sự dịch chuyển đến các hệ sinh thái dữ liệu phi tập trung, thuộc sở hữu của người dùng.

Sự Xuất Hiện Của Các Tầng Dữ Liệu

Trong Web3, có một hệ sinh thái ngày càng phát triển về các tầng dữ liệu, giao thức và cơ sở hạ tầng tập trung vào việc tạo điều kiện cho chủ quyền dữ liệu cá nhân - ý tưởng về việc cho cá nhân nhiều quyền kiểm soát hơn về dữ liệu của họ, với các lựa chọn để kiếm tiền từ nó.

1. Vana

@vanaSứ mệnh cốt lõi của 's là cung cấp cho người dùng quyền kiểm soát dữ liệu của họ, đặc biệt là trong bối cảnh của trí tuệ nhân tạo, nơi dữ liệu vô giá để huấn luyện các mô hình.

Vana giới thiệu DataDAOs, các thực thể do cộng đồng điều hành trong đó người dùng gom góp dữ liệu của họ vì lợi ích chung. Mỗi DataDAO tập trung vào một bộ dữ liệu cụ thể:

  • r/datadao: Tập trung vào dữ liệu người dùng Reddit, cho phép người dùng kiểm soát và tiền tệ hóa đóng góp của mình.
  • Volara: Xử lý dữ liệu Twitter, cho phép người dùng tận dụng hoạt động trên mạng xã hội của họ.
  • DNA DAO: Nhắm vào việc quản lý dữ liệu gen với tư duy về quyền riêng tư và sở hữu.

Vana token hóa dữ liệu thành một tài sản có thể giao dịch được gọi là "DLP". Mỗi DLP tổng hợp dữ liệu cho một miền cụ thể và người dùng có thể đặt cược mã thông báo vào các nhóm này để nhận phần thưởng, với các nhóm hàng đầu được thưởng dựa trên hỗ trợ cộng đồng và chất lượng dữ liệu.

Điểm nổi bật của Vana là sự dễ dàng trong việc đóng góp dữ liệu. Người dùng chỉ cần:

  1. Chọn một DataDAO
  2. Gom dữ liệu trực tiếp qua tích hợp API hoặc tải lên thủ công
  3. Kiếm token DataDAO và $VANAnhư phần thưởng

2. Ocean Protocol

@oceanprotocollà một Thị trường Dữ liệu Phi tập trung cho phép nhà cung cấp dữ liệu chia sẻ, bán hoặc cấp phép dữ liệu của họ, trong khi người tiêu dùng truy cập nó cho AI và nghiên cứu.

Ocean Protocol sử dụng “datatokens” (ERC-20 tokens) để đại diện cho quyền truy cập vào bộ dữ liệu, cho phép người cung cấp dữ liệu kiếm tiền từ dữ liệu của họ trong khi vẫn giữ quyền kiểm soát về điều kiện truy cập.

Các loại dữ liệu được giao dịch trên Ocean:

  • Dữ liệu Công cộng: Các bộ dữ liệu mở như thông tin thời tiết, dân số công cộng hoặc dữ liệu lịch sử về cổ phiếu - có giá trị cho việc đào tạo và nghiên cứu trí tuệ nhân tạo.
  • Dữ liệu Riêng tư: Hồ sơ y tế, giao dịch tài chính, dữ liệu cảm biến IoT, hoặc dữ liệu người dùng cá nhân—yêu cầu kiểm soát quyền riêng tư nghiêm ngặt.

Compute-to-Data là một tính năng quan trọng khác của Ocean, cho phép tính toán được thực hiện trên dữ liệu mà không cần di chuyển nó, đảm bảo sự riêng tư và bảo mật cho các tập dữ liệu nhạy cảm.

3. Masa

@getmasafitập trung vào việc tạo ra một lớp mở cho dữ liệu huấn luyện trí tuệ nhân tạo, cung cấp dữ liệu thời gian thực, chất lượng cao và giá rẻ cho các đại lý và nhà phát triển trí tuệ nhân tạo.

Masa đã ra mắt hai mạng lưới con trên mạng lưới Bittensor:

  • Subnet 42 (SN42): Tập hợp và xử lý hàng triệu bản ghi dữ liệu hàng ngày, đóng vai trò là nền tảng cho việc phát triển trí tuệ nhân tạo và ứng dụng.
  • Subnet 59 (SN59) – “AI Agent Arena”: Môi trường cạnh tranh nơi mà các tác nhân trí tuệ nhân tạo, được cung cấp bởi dữ liệu thời gian thực từ SN42, cạnh tranh cho $TAOKhí thải dựa trên các chỉ số hiệu suất như phổ biến, tương tác người dùng và tự cải thiện.

Masa hợp tác với @virtuals_io, làm cho các đại lý ảo có khả năng dữ liệu thời gian thực. Nó cũng đã ra mắt $TAOCAT, giới thiệu khả năng của nó (hiện đang ở Binance Alpha).

4. Sổ cái mở

@OpenledgerHQđang xây dựng một blockchain đặc biệt dành cho dữ liệu, đặc biệt là cho ứng dụng AI và ML, đảm bảo quản lý dữ liệu an toàn, phi tập trung và có thể xác minh.

Key Highlights:

  • Datanets: Mạng lưới cung cấp dữ liệu chuyên biệt trong OpenLedger, thu thập và làm giàu dữ liệu thế giới thực cho ứng dụng AI.
  • SLMs: Mô hình trí tuệ nhân tạo được tùy chỉnh cho các ngành hoặc ứng dụng cụ thể. Ý tưởng là cung cấp các mô hình không chỉ chính xác hơn cho các trường hợp sử dụng cụ thể mà còn tuân thủ quyền riêng tư và ít bị sai lệch hơn so với các mô hình đa năng.
  • Xác minh dữ liệu: Đảm bảo tính chính xác và đáng tin cậy của dữ liệu được sử dụng để huấn luyện các mô hình ngôn ngữ chuyên ngành (SLMs) mà có độ chính xác và đáng tin cậy cho các trường hợp sử dụng cụ thể.

Nhu cầu dữ liệu cho việc đào tạo trí tuệ nhân tạo

Nhu cầu về dữ liệu chất lượng cao để cung cấp năng lượng cho trí tuệ nhân tạo và các đại lý tự động đang tăng cao. Ngoài việc đào tạo ban đầu, các đại lý trí tuệ nhân tạo đòi hỏi dữ liệu thời gian thực để liên tục học tập và thích nghi.

Những thách thức và cơ hội chính:

  • Chất lượng dữ liệu quan trọng hơn số lượng: Các mô hình AI cần có dữ liệu chất lượng cao, đa dạng và liên quan để tránh thiên vị hoặc hiệu suất kém.
  • Chủ quyền dữ liệu và quyền riêng tư: Như đã thấy với Vana, có một sự đẩy mạnh để tạo ra thu nhập từ dữ liệu sở hữu của người dùng, điều này có thể thay đổi cách dữ liệu huấn luyện trí tuệ nhân tạo được thu thập.
  • Dữ liệu tổng hợp: Với những lo ngại về quyền riêng tư, dữ liệu tổng hợp đang trở nên phổ biến như một cách để huấn luyện mô hình trí tuệ nhân tạo trong khi giảm thiểu các vấn đề đạo đức.
  • Thị trường dữ liệu: Sự bùng nổ của các chợ dữ liệu (tập trung và phi tập trung) đang tạo ra một nền kinh tế trong đó dữ liệu là một tài sản có thể trao đổi.
  • Trí tuệ nhân tạo cho Quản lý Dữ liệu: Trí tuệ nhân tạo hiện đã được sử dụng để quản lý, làm sạch và cải thiện bộ dữ liệu, nâng cao chất lượng dữ liệu cho việc huấn luyện trí tuệ nhân tạo.

Khi các đại lý AI trở nên tự trị hơn, khả năng truy cập và xử lý dữ liệu chất lượng cao thời gian thực sẽ quyết định đến hiệu quả của chúng. Nhu cầu ngày càng tăng đã dẫn đến sự gia tăng của các thị trường dữ liệu đặc biệt cho các đại lý AI - nơi cả con người và đại lý AI có thể tiếp cận với dữ liệu chất lượng cao của đại lý AI.

Thị trường dữ liệu cho Web3 Agents

  • @cookiedotfuntập hợp dữ liệu cảm xúc xã hội của đại lý trí tuệ nhân tạo & liên quan đến token, biến nó thành cái nhìn có thể hành động cho con người và đại lý trí tuệ nhân tạo.
  • Cookie DataSwarm API cho phép các đại lý trí tuệ nhân tạo truy cập dữ liệu hiện tại, chất lượng cao để có thông tin liên quan đến giao dịch - một trong những trường hợp sử dụng được tìm kiếm nhất trong lĩnh vực tiền điện tử.
  • Cookie tự hào có 200K MAU & 20K DAU, khiến nó trở thành một trong những thị trường dữ liệu AI lớn nhất với AI agent.$COOKIEtại trung tâm.

Các nhân vật chính khác:

  • @GoatIndexAItập trung vào cái nhìn về hệ sinh thái Solana.
  • @DecentralisedcoChuyên về bảng điều khiển dữ liệu hẹp như các kho lưu trữ GitHub và phân tích cụ thể cho dự án.

Kết thúc Phần 1

Đây chỉ là khởi đầu. Phần 2 sẽ đi sâu vào:

  • Những thách thức và cơ hội tiềm ẩn trong nền kinh tế dữ liệu đang ngày càng phát triển
  • Vai trò của dữ liệu tổng hợp trong việc huấn luyện trí tuệ nhân tạo
  • Mối quan tâm về quyền riêng tư dữ liệu và cách mà chúng đang được giải quyết
  • Tương lai của việc đào tạo trí tuệ nhân tạo phi tập trung

Ai kiểm soát dữ liệu sẽ định hình tương lai, và các dự án xây dựng trong lĩnh vực này sẽ xác định cách dữ liệu được sở hữu, chia sẻ và tiền hoá trong thời đại AI. Khi nhu cầu về dữ liệu chất lượng cao tiếp tục tăng, cuộc đua để tạo ra một nền kinh tế dữ liệu minh bạch hơn, do người dùng sở hữu, chỉ mới bắt đầu.

Hãy đón xem Phần 2!

Ghi chú cá nhân: Cảm ơn đã đọc! Nếu bạn đang trong Crypto AI và muốn kết nối, hãy tự nhiên nhắn tin cho tôi.

Nếu bạn muốn đề xuất một dự án, vui lòng sử dụng biểu mẫu trong hồ sơ của tôi - nó được ưu tiên hơn tin nhắn trực tiếp.

Toàn bộ thông báo: Tài liệu này chỉ dành cho mục đích thông tin & giải trí. Các quan điểm được thể hiện trong tài liệu này không phải là, và không nên được hiểu là, lời khuyên đầu tư hoặc đề xuất. Người nhận tài liệu này nên tự thực hiện công việc nghiên cứu cẩn thận, xem xét tình hình tài chính cụ thể của họ, mục tiêu đầu tư và khả năng chịu đựng rủi ro (không được xem xét trong tài liệu này) trước khi đầu tư. Tài liệu này không phải là một đề nghị, cũng không phải là lời mời để mua hoặc bán bất kỳ tài sản nào được đề cập ở đây.

Thông báo từ chối trách nhiệm:

  1. Bài viết này được sao chép từX. Bản quyền thuộc về tác giả gốc [@Defi0xJeff]. Nếu có bất kỳ ý kiến ​​nào về việc sao chép, vui lòng liên hệgate Learn Team, và nhóm sẽ xử lý nó theo các quy trình liên quan.
  2. Miễn trách nhiệm về trách nhiệm: Quan điểm và ý kiến được thể hiện trong bài viết này chỉ thuộc về tác giả và không đại diện cho lời khuyên đầu tư.
  3. Nhóm Gate Learn dịch bài viết sang các ngôn ngữ khác. Việc sao chép, phân phối hoặc đạo văn bản dịch là cấm trừ khi được đề cập.

Mời người khác bỏ phiếu

Lịch Tiền điện tử

Cập nhật dự án
Etherex sẽ ra mắt Token REX vào ngày 6 tháng 8.
REX
22.27%
2025-08-06
Ngày Phát Triển và Quản Trị Hiếm ở Las Vegas
Cardano sẽ tổ chức Ngày Phát triển & Quản trị Rare tại Las Vegas, từ ngày 6 đến 7 tháng 8, với các buổi hội thảo, hackathon và thảo luận bàn tròn tập trung vào các chủ đề phát triển kỹ thuật và quản trị.
ADA
-3.44%
2025-08-06
Blockchain.Rio ở Rio De Janeiro
Stellar sẽ tham gia hội nghị Blockchain.Rio, dự kiến diễn ra tại Rio de Janeiro, từ ngày 5 đến 7 tháng 8. Chương trình sẽ bao gồm các bài phát biểu chính và các cuộc thảo luận nhóm có sự tham gia của đại diện hệ sinh thái Stellar phối hợp với các đối tác Cheesecake Labs và NearX.
XLM
-3.18%
2025-08-06
Hội thảo web
Circle đã công bố một hội thảo trực tuyến Executive Insights có tiêu đề "Kỷ Nguyên GENIUS Act Bắt Đầu", dự kiến diễn ra vào ngày 7 tháng 8 năm 2025, lúc 14:00 UTC. Phiên họp sẽ khám phá những tác động của GENIUS Act vừa được thông qua - khung quy định liên bang đầu tiên cho các stablecoin thanh toán tại Hoa Kỳ. Dante Disparte và Corey Then của Circle sẽ lãnh đạo cuộc thảo luận về cách mà luật pháp ảnh hưởng đến đổi mới tài sản kỹ thuật số, sự rõ ràng về quy định, và vị thế lãnh đạo của Hoa Kỳ trong cơ sở hạ tầng tài chính toàn cầu.
USDC
-0.03%
2025-08-06
AMA trên X
Ankr sẽ tổ chức một AMA trên X vào ngày 7 tháng 8 lúc 16:00 UTC, tập trung vào công việc của DogeOS trong việc xây dựng lớp ứng dụng cho DOGE.
ANKR
-3.23%
2025-08-06

Bài viết liên quan

Hướng Dẫn Phòng Chống Airdrop Lừa Đảo
Người mới bắt đầu

Hướng Dẫn Phòng Chống Airdrop Lừa Đảo

Bài viết này đi sâu vào các airdrop Web3, các loại phổ biến và các trò gian lận tiềm ẩn mà chúng có thể liên quan. Nó cũng thảo luận về cách những kẻ lừa đảo lợi dụng sự phấn khích xung quanh airdrop để bẫy người dùng. Bằng cách phân tích trường hợp airdrop Jupiter, chúng tôi phơi bày cách thức hoạt động của các trò gian lận tiền điện tử và mức độ nguy hiểm của chúng. Bài viết cung cấp các mẹo hữu ích để giúp người dùng xác định rủi ro, bảo vệ tài sản của họ và tham gia airdrop một cách an toàn.
10/24/2024, 2:33:05 PM
Giới thiệu về Aleo Privacy Blockchain
Người mới bắt đầu

Giới thiệu về Aleo Privacy Blockchain

Khi công nghệ blockchain phát triển nhanh chóng, bảo vệ quyền riêng tư đã trở thành một vấn đề cấp bách. Aleo giải quyết những thách thức về quyền riêng tư và khả năng mở rộng, nâng cao an ninh mạng và phát triển bền vững. Bài viết này đi sâu vào những ưu điểm kỹ thuật của Aleo, các lĩnh vực ứng dụng, tokenomics và triển vọng trong tương lai.
11/7/2024, 9:33:47 AM
Khóa riêng tư và cụm từ hạt giống: Sự khác biệt chính
Người mới bắt đầu

Khóa riêng tư và cụm từ hạt giống: Sự khác biệt chính

Phương pháp chính để lưu trữ tiền điện tử của bạn là thông qua ví điện tử. Quản lý ví là một kỹ năng riêng biệt, và hiểu cách nó hoạt động là một phần quan trọng để bảo vệ quỹ của bạn. Bài viết này sẽ bao gồm khóa riêng tư và cụm từ khóa gốc - hai thành phần quan trọng của quản lý ví - và cách sử dụng chúng để đảm bảo quỹ của bạn được giữ an toàn nhất có thể.
11/27/2024, 3:22:37 AM
Tiền điện tử so với máy tính lượng tử
Người mới bắt đầu

Tiền điện tử so với máy tính lượng tử

Tác động toàn diện của máy tính lượng tử đối với tiền điện tử là một vấn đề rất quan trọng đối với ngành công nghiệp này. Khi máy tính lượng tử được phát triển hoàn chỉnh, nó có thể vỡ mã hóa đằng sau các loại tiền điện tử trong vài phút. Nếu bạn sở hữu tiền điện tử, hãy tiếp tục đọc để tìm hiểu về mối đe dọa của tiền điện tử so với máy tính lượng tử, tương lai của tiền điện tử và máy tính lượng tử, và những gì bạn có thể làm để bảo vệ mình.
11/10/2024, 12:02:16 PM
Các Chiêu Lừa Đảo Đa Chữ Ký Là Gì Và Người Dùng Làm Thế Nào Để Bảo Vệ Chính Mình?
Trung cấp

Các Chiêu Lừa Đảo Đa Chữ Ký Là Gì Và Người Dùng Làm Thế Nào Để Bảo Vệ Chính Mình?

Công nghệ Đa chữ ký (multisig) đã cải thiện đáng kể tính bảo mật và linh hoạt của việc lưu trữ tiền điện tử. Bằng cách loại bỏ điểm thất bại duy nhất liên quan đến khóa riêng tư, nó tạo nên nền tảng vững chắc cho quản lý tài sản, ứng dụng doanh nghiệp và dịch vụ tài chính sáng tạo. Tuy nhiên, giống như bất kỳ hệ thống phức tạp nào, Đa chữ ký cũng có thể trở thành mục tiêu của các kẻ tấn công, và các vụ lừa đảo liên quan đến nó ngày càng phổ biến. Bài viết này khám phá ưu điểm và rủi ro của các giải pháp Đa chữ ký và cung cấp các mẹo an toàn thực tế để giúp người dùng tận dụng đầy đủ các lợi ích của ví Đa chữ ký trong khi giảm thiểu các mối đe dọa tiềm ẩn.
4/7/2025, 2:25:00 PM
Hiểu về cuộc tấn công quản trị: Một nghiên cứu trường hợp về Compound
Người mới bắt đầu

Hiểu về cuộc tấn công quản trị: Một nghiên cứu trường hợp về Compound

Các cuộc tấn công vào quản trị đặt một mối đe dọa lớn đối với an ninh trong quản trị blockchain phi tập trung. Bài viết này xem xét cuộc tấn công quản trị vào Compound, mô tả các phương pháp, rủi ro ngắn hạn và dài hạn liên quan, cũng như cách cải tiến kỹ thuật và nỗ lực của cộng đồng có thể giúp giảm thiểu những thách thức này. Nó cũng thảo luận về chiến lược phòng ngừa và nhấn mạnh tác động lâu dài của các cuộc tấn công quản trị đối với các giao thức DeFi và hệ sinh thái rộng hơn, giúp ngành công nghiệp chuẩn bị tốt hơn cho các mối đe dọa quản trị trong tương lai.
9/25/2024, 6:59:17 AM
Bắt đầu giao dịch
Đăng ký và giao dịch để nhận phần thưởng USDTEST trị giá
$100
$5500