ANTHROPIC MENEMUKAN CARA UNTUK MENGIMUNISASI AI TERHADAP KEPUTUSAN YANG SANGAT BURUK



Anthropic mengklaim bahwa mereka sekarang dapat memvaksinasi AI terhadap kejahatan.

Menggunakan "persona vectors" untuk melacak sifat-sifat seperti penipuan atau penjilat, para peneliti melatih model bahasa dengan sengaja menyuntikkan perilaku buruk, kemudian
BAD1.47%
Lihat Asli
post-image
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • 7
  • Posting ulang
  • Bagikan
Komentar
0/400
DaoResearchervip
· 08-10 10:28
Dari data makalah terkait, penyuntikan kebiasaan buruk memiliki tingkat kesalahan yang terlalu besar dalam evaluasi AUC.
Lihat AsliBalas0
PrivacyMaximalistvip
· 08-09 22:28
Imun terhadap kejahatan? Jangan bercanda.
Lihat AsliBalas0
GasSavingMastervip
· 08-07 13:57
Jadi setelah vaksin selesai, sudah memiliki keadilan sendiri, ya?
Lihat AsliBalas0
AlphaLeakervip
· 08-07 13:56
Apakah trik ini mencuci otak AI atau manusia?
Lihat AsliBalas0
GhostAddressHuntervip
· 08-07 13:49
Apakah kecerdasan buatan juga harus divaksin?
Lihat AsliBalas0
GhostAddressMinervip
· 08-07 13:40
Eh AI adalah AI, semua program yang rumit itu juga ada jejaknya.
Lihat AsliBalas0
NotFinancialAdviservip
· 08-07 13:31
Apa gunanya berpura-pura menjadi orang baik
Lihat AsliBalas0
  • Sematkan
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)