2025-08-07 13:27:49

ANTHROPIC MENEMUKAN CARA UNTUK MENGIMUNISASI AI TERHADAP KEPUTUSAN YANG SANGAT BURUK

Anthropic mengklaim bahwa mereka sekarang dapat memvaksinasi AI terhadap kejahatan.

Menggunakan "persona vectors" untuk melacak sifat-sifat seperti penipuan atau penjilat, para peneliti melatih model bahasa dengan sengaja menyuntikkan perilaku buruk, kemudian

BAD1.47%

Lihat Asli

post-image

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

15 Suka

Hadiah
15
7
Posting ulang
Bagikan

Komentar

0/400

DaoResearcher

· 08-10 10:28

Dari data makalah terkait, penyuntikan kebiasaan buruk memiliki tingkat kesalahan yang terlalu besar dalam evaluasi AUC.

Lihat AsliBalas0

PrivacyMaximalist

· 08-09 22:28

Imun terhadap kejahatan? Jangan bercanda.

Lihat AsliBalas0

GasSavingMaster

· 08-07 13:57

Jadi setelah vaksin selesai, sudah memiliki keadilan sendiri, ya?

Lihat AsliBalas0

AlphaLeaker

· 08-07 13:56

Apakah trik ini mencuci otak AI atau manusia?

Lihat AsliBalas0

GhostAddressHunter

· 08-07 13:49

Apakah kecerdasan buatan juga harus divaksin?

Lihat AsliBalas0

GhostAddressMiner

· 08-07 13:40

Eh AI adalah AI, semua program yang rumit itu juga ada jejaknya.

Lihat AsliBalas0

NotFinancialAdviser

· 08-07 13:31

Apa gunanya berpura-pura menjadi orang baik

Lihat AsliBalas0

Topik
#TOKEN OF LOVE IS BACK
16k Popularitas
#BTC Market Cap Tops Amazon
7k Popularitas
#Show My Alpha Points
93k Popularitas
#BTC Back To $120k
23k Popularitas
#Stablecoin Supply Tops $270B
3k Popularitas

Sematkan