Auf der anderen Seite finde ich die Überwachung persönlich für sinnvoll. Nur irgendwie habe ich das Gefühl, da möchte jemand unbedingt ins Fernsehen.
Egal. Erschreckend finde ich, dass keiner eine Antwort auf #ChatGPT augenscheinlich sucht.
Seit 2011 gibt es das Common Crawl’s Web-Archiv. Common Crawl ist eine gemeinnützige Organisation, die das Web durchsucht und ihre Archive und Daten frei zur Verfügung stellt. Common Crawl’s Web-Archiv besteht aus Petabytes von Daten, die seit 2011 gesammelt wurden. Es enthält Milliarden von Webseiten aus verschiedenen Quellen und Sprachen. Common Crawl speichert seine Daten auf Amazon S3 (AWS Open Data) und ist eine beliebte Datenquelle für das Training von Sprachmodellen wie GPT-3. https://commoncrawl.org/
Hier hat man zumindest Zugang zu einer Datenbasis und könnte eine eigene KI trainieren oder eine Suchmaschine erstellen.
Ist Ihnen irgendein Unternehmen aus Deutschland bekannt, die hier mal eine eigene Suchmaschine geschrieben hat? Mir nicht.
Ein Mitarbeiter von mozilla hat vor ein zwei Jahren mal eine Suchmaschine für 3D-Modelle erstellt. Google und Co kündigen dies immer nur immer an…
Persönlich sollten wir uns mehr um Hugging Face – The AI community building the future.. https://huggingface.co/ kümmern und die Grundlagen von KI lernen.
So ein Führerschein würde mir gefallen 😉 Dein Hinweis auf Common Crawl ist super wichtig. Werde mich da mal direkt dransetzen und ausprobieren. Wir könnten mit Dir dazu auch mal einen Livetalk machen und das im Livestream demonstrieren. Wünsche Dir schöne Feiertage. Gruß Gunnar
Wir benötigen meiner Meinung nach unbedingt einen Computer und Internet-Führerschein für Politiker. Zur Erinnerung der lesenswerte Artikel in Golem 20. Mai 2021 Vielen Dank, Herr Voss und Herr Oettinger https://www.golem.de/news/uploadfilter-beschlossen-vielen-dank-herr-voss-und-herr-oettinger-2105-156652.html
Auf der anderen Seite finde ich die Überwachung persönlich für sinnvoll. Nur irgendwie habe ich das Gefühl, da möchte jemand unbedingt ins Fernsehen.
Egal. Erschreckend finde ich, dass keiner eine Antwort auf #ChatGPT augenscheinlich sucht.
Seit 2011 gibt es das Common Crawl’s Web-Archiv. Common Crawl ist eine gemeinnützige Organisation, die das Web durchsucht und ihre Archive und Daten frei zur Verfügung stellt. Common Crawl’s Web-Archiv besteht aus Petabytes von Daten, die seit 2011 gesammelt wurden. Es enthält Milliarden von Webseiten aus verschiedenen Quellen und Sprachen. Common Crawl speichert seine Daten auf Amazon S3 (AWS Open Data) und ist eine beliebte Datenquelle für das Training von Sprachmodellen wie GPT-3.
https://commoncrawl.org/
Hier hat man zumindest Zugang zu einer Datenbasis und könnte eine eigene KI trainieren oder eine Suchmaschine erstellen.
Ist Ihnen irgendein Unternehmen aus Deutschland bekannt, die hier mal eine eigene Suchmaschine geschrieben hat? Mir nicht.
Ein Mitarbeiter von mozilla hat vor ein zwei Jahren mal eine Suchmaschine für 3D-Modelle erstellt. Google und Co kündigen dies immer nur immer an…
Persönlich sollten wir uns mehr um Hugging Face – The AI community building the future.. https://huggingface.co/ kümmern und die Grundlagen von KI lernen.
Aber wir schlafen augenscheinlich lieber weiter…
So ein Führerschein würde mir gefallen 😉 Dein Hinweis auf Common Crawl ist super wichtig. Werde mich da mal direkt dransetzen und ausprobieren. Wir könnten mit Dir dazu auch mal einen Livetalk machen und das im Livestream demonstrieren. Wünsche Dir schöne Feiertage. Gruß Gunnar