DarkBERT ist mit Daten aus dem Darknet trainiert – ChatGPTs du | Freie Medien

DarkBERT ist mit Daten aus dem Darknet trainiert – ChatGPTs dunkler Bruder?

Ein südkoreanisches Forscherteam hat das Tor-Netzwerk durchkämmt für einen Datensatz zum Training großer Sprachmodelle (Large Language Models, kurz LLM).

Die auf unkonventionelle Weise beschafften Daten stammen ausschließlich aus dem Darknet, also potenziell von Hackern, Cyberkriminellen und Betrügern – sowie von politisch Verfolgten und anderen, die die Anonymität schätzen, sei es für undurchsichtige Geschäfte oder zum unbeobachteten Austausch von Informationen etwa unter einem repressiven Regime.[...]

Ein Blick auf die Fakten: Dunkelberts Schöpfer haben nach eigenen Angaben nicht im Sinn, die Weltherrschaft an sich zu reißen oder Inhalte des verborgenen Internets in den sichtbaren Bereich des Internets (Clear Web) zu gießen, wenngleich sie ihrem Werk durch die Bezeichnung eine düstere Note verpasst haben.[...]

Ziel der Forschung sei es, die Sprache des Darknets weiter zu erschließen, geht aus dem Vorspann des Berichts hervor. Sprachmodelle, die gezielt für das Dark Web entwickelt sind, könnten "wertvolle Erkenntnisse liefern". [...]

Zum ganzen Artikel:
https://www.heise.de/news/DarkBERT-ist-mit-Daten-aus-dem-Darknet-trainiert-ChatGPTs-dunkler-Bruder-9060809.html

FreieMedien kostenlos abonnieren

Substack & Newsletter (free)
Twitter | GETTR | Odysee | Bastyon

Freie Medien

🕵️ 140.26K
Nachrichten

Wir bringen die Stimmen, Infos und Meinungen der alternativen Medien zensurfrei auf eine Plattform & setzen Impulse. Prüft & recherchiert bevor ihr glaubt. Kontakt: @FreieMedienBot. www.fb.com/freiem...

Join
▲ Vote (1)

DarkBERT ist mit Daten aus dem Darknet trainiert – ChatGPTs du | Freie Medien

Login