Google heeft vandaag aangekondigd dat het een openbare discussie start over de ontwikkeling van nieuwe protocollen en richtlijnen voor hoe kunstmatige-intelligentiesystemen toegang krijgen tot en gebruik maken van website-inhoud. In een blogpost wil Google “technische en ethische normen verkennen die webuitgevers in staat stellen nieuwe AI- en onderzoeksgebruiksscenario’s te kiezen en te controleren”. De aankondiging volgt op de recente I/O-conferentie van Google, waar het bedrijf nieuwe AI-producten en zijn AI-principes besprak, die tot doel hebben AI-systemen eerlijk, transparant en verantwoordelijk te maken. De blogpost van Google luidt: “Wij geloven dat een levendig content-ecosysteem iedereen ten goede komt. Het belangrijkste is dat webuitgevers een zinvolle keuze en controle hebben over hun inhoud en kansen om te profiteren van deelname aan het webecosysteem. Google erkent dat technische standaarden zoals robots.txt bijna 30 jaar geleden zijn gemaakt en ouder zijn dan moderne AI-technologieën die webgegevens op schaal kunnen analyseren. Met Robots.txt kunnen uitgevers specificeren hoe zoekmachines content crawlen en indexeren. Maar het ontbreekt aan mechanismen voor hoe AI-systemen gegevens kunnen gebruiken om algoritmen te trainen of nieuwe producten te maken. Google nodigt internet- en AI-gemeenschappen, waaronder webuitgevers, academici, maatschappelijke groeperingen en haar partners, uit om deel te nemen aan de openbare discussie over het ontwikkelen van nieuwe protocollen en ethische richtlijnen. Google zegt: “We willen dat dit een open proces is en we hopen dat veel belanghebbenden zullen deelnemen en bespreken hoe vooruitgang op het gebied van kunstmatige intelligentie kan worden afgewogen tegen privacy, bureau- en gegevenscontrole. Het debat weerspiegelt een groeiende erkenning dat AI-technologieën webgegevens op nieuwe manieren kunnen benutten die ethische uitdagingen met zich meebrengen rond gegevensgebruik, privacy en vooringenomenheid. Door een open proces op gang te brengen, zoekt Google naar een gezamenlijke oplossing die tegemoet komt aan de belangen van technologiebedrijven en makers van inhoud. De resultaten van deze discussies kunnen de komende jaren de manier veranderen waarop kunstmatige-intelligentiesystemen omgaan met webpaginagegevens en deze gebruiken. “Het web heeft zoveel vooruitgang geboekt en AI kan op die vooruitgang voortbouwen”, zegt Google. “Maar we moeten het goed doen.”
Een kritiek op de gegevensverzamelingsmethoden van Google
Google zegt dat het kritiek krijgt op de hoeveelheid gegevens die het al op internet heeft verzameld om kunstmatige-intelligentiesystemen en taalmodellen te trainen. Deze praktijken voor het verzamelen van gegevens worden uiteengezet in de update van het privacybeleid van Google. Sommigen in de SEO-gemeenschap beweren dat de inspanningen van Google too little too late zijn. Barry Adams spotte met de aankondiging op Twitter en zei: “Nu we onze LLM’s hebben getraind in al uw eigen en auteursrechtelijk beschermde inhoud, gaan we er eindelijk over nadenken om u af te melden voor toekomstige inhoud voor gebruik. om rijk te zijn.” Anderen vinden dat Google meer moet doen om feedback te verzamelen tijdens het proces. Reismarketeer Nate Hake twitterde: “Om een debat te starten, moet je de andere partij iets laten ZEGGEN. Het is maar een e-mail. mail capture formulier. Er is geen veld voor feedback. Zelfs geen bevestigingsbericht.”
AI wordt aangedreven door data – maar hoeveel is te veel?
Kunstmatige-intelligentiesystemen hebben veel gegevens nodig om te functioneren, te verbeteren en de samenleving ten goede te komen. Maar hoe meer data AI heeft, hoe groter het risico voor de individuele privacy. Er zijn complexe afwegingen tussen het mogelijk maken van AI-vooruitgang en het beschermen van de informatie van mensen. Er is discussie over de vraag of mensen zich moeten kunnen afmelden voor AI met behulp van hun openbare socialemediagegevens. Sommigen beweren dat individuen controle moeten hebben over hun gegevens, terwijl anderen beweren dat dit de voortgang van AI vertraagt. Beide partijen voeren geldige argumenten aan en we zijn het nog lang niet eens over de juiste politieke aanpak.
Een blik vooruit
Google’s oproep tot discussie is een stap in de goede richting, maar het bedrijf moet stappen ondernemen om de ontvangen feedback te implementeren. Google staat niet alleen voor deze uitdagingen. Elk technologiebedrijf dat AI ontwikkelt, vertrouwt op gegevens die via internet zijn verzameld. De hele technologie-industrie zou deel moeten uitmaken van de discussie, niet alleen Google.
Uitgelichte afbeelding: JDres/Shutterstock