Das Internet, früher eine offene Quelle für Entwickler, wird immer geschlossener. Gute Daten sind wichtig, um Künstliche Intelligenz (KI) wie ChatGPT zu trainieren. Diese Daten werden nun selten und teuer. Das ändert die Macht in der gesamten KI-Branche stark.
Weniger gute Trainingsdaten sind ein großer Wandel für die KI-Branche. Daten werden sehr wertvoll, wie Gold. Wer Daten hat oder sie kontrolliert, bestimmt die Zukunft der Künstlichen Intelligenz. Das entscheidet, welche Firma erfolgreich ist und welche zurückfällt.
Analyst Nils Matthiesen von Golem.de sagt: Das offene Internet, lange eine Quelle für kostenlose Daten, schließt sich. Immer mehr Inhalte werden für KI-Programme, sogenannte Crawler, gesperrt. Oder sie sind nur noch gegen Bezahlung verfügbar. Das macht gute Trainingsdaten für KI-Modelle wie Große Sprachmodelle (LLMs) teurer. Sie werden auch exklusiver, also nur für wenige zugänglich. Es ist ein direkter Preiskampf um diesen digitalen Rohstoff für KI.
Für Privatpersonen und Leute, die Inhalte erstellen, bedeutet das: Dein digitaler Inhalt wird wertvoll. Das gilt für Blogs, soziale Medien oder Foren. Du willst ihn vielleicht nicht mehr kostenlos hergeben. Gleichzeitig könnten KI-Inhalte, die mit teureren Daten trainiert wurden, besser werden. Das könnte aber auch zu höheren Kosten für Abonnements führen. Du bist entweder ein unbezahlter Lieferant von Rohmaterial oder du zahlst am Ende für bessere Ergebnisse.
Für Unternehmen ist die Lage ernst. Der Zugang zu guten Trainingsdaten wird entscheidend für den Erfolg im Wettbewerb. Firmen ohne eigene große Datensätze oder die sich den Einkauf nicht leisten können, könnten zurückfallen. Das zwingt Unternehmen zu Partnerschaften. Oder sie müssen in den Kauf eigener Daten investieren. So sichern sie die Entwicklung und Leistung ihrer KI-Produkte. Sie wollen nicht von den Firmen abhängig sein, die Daten besitzen.
Neue Geschäftsmodelle entstehen für Datenanbieter. Wer spezielle, gute Datensätze anbieten kann, hat jetzt die Chance auf viel Geld. Auch Firmen mit großen, ungenutzten internen Daten können diese zu Geld machen. Oder sie nutzen sie für die eigene KI-Entwicklung. So bekommen sie einen Vorteil gegenüber der Konkurrenz. Jetzt ist der Moment, um aus Daten echtes Geld zu machen.






