Hoe werkt een AI zoekmachine?

De data raakt op. Help! En data dat is de brandstof voor AI modellen. Online data, dus jouw artikelen en posts op internet. De berichten van experts en deskundigen die gewaardeerd worden en veel bezocht wordt, raakt op.

Verdwijnt dat dan of zoiets? Is er een Bermuda-driehoek of een zwart gat op internet gevonden? Is de Google zoekmachine stuk?

Voor het trainen van AI modellen als ChatGPT, Gemini en Claude wordt digitale data gebruikt.

En dan geldt: hoe meer data, hoe beter A.I. modellen werken. AI-modellen worden nauwkeuriger en menselijker worden met meer gegevens.

Hoe meer boeken, essays en andere informatie er wordt gelezen door mensen, hoe meer we weten, hoe meer we begrijpen en hoe beter we verbanden kunnen leggen. Dat geldt ook zo voor grote taalmodellen, de AI-systemen die de basis vormen van chatbots. Ze worden nauwkeuriger en krachtiger als ze meer gegevens krijgen.

Sommige grote taalmodellen, zoals OpenAI's GPT-3 werden getraind op honderden miljarden ‘tokens’. Tokens zijn hele woorden of stukjes woorden. De meest nieuw AI modellen werden getraind op meer dan drie biljoen tokens.

Chat GPT-3 werd getraind op miljarden voornamelijk Engelstalige websites, boeken en Wikipedia-artikelen verzameld van het internet. Maar openbaar beschikbare online data om A.I.-modellen te ontwikkelen, wordt sneller opgebruikt dan nieuwe data wordt geproduceerd.

Digitale data van hoge kwaliteit zal in 2026 op zijn. ‘Van hoge kwaliteit’ betekent professionals en deskundigen hebben teksten geschreven, die andere deskundigen gecontroleerd hebben, citeren en hergebruiken om hun zienswijze te geven. Die data wordt dus doorgegeven aan elkaar.

Techbedrijven doen er alles aan om meer en nieuwe data te verkrijgen. De makers van ChatGPT (OpenAI) , Google (Gemini) en Meta (FaceBook) zoeken nieuwe manieren om data te verzamelen.

Ze veranderen hun gebruikersvoorwaarden zodat ze de data in de gratis versies bijvoorbeeld kunnen gebruiken.

Als er niet genoeg diamanten zijn, dan maak je er zelf eentje in een laboratorium. Dat heet dan een 'synthetische diamant'. Kun je er toch geld mee verdienen.

Bij data kunnen we ook overschakelen op 'synthetische' data. Data gemaakt door een AI model en daarmee andere AI’s gaan trainen. Synthetische data is riskant omdat A.I.-modellen fouten kunnen maken. Dat heet dan geen liegen maar hallucineren. Alleen jij en ik weet dan dat de informatie niet klopt, maar hoe kan de AI dat doen? Anders blijft die foute data overal in doorwerken.

Wordt vervolgd.

Je website verliest nu al bezoekers, want Google gaat door AI helemaal anders werken. Wil je weten hoe zoekmachines met AI gaan werken, en wat je dan moet doen?
Om zichtbaar en vindbaar te blijven?

Ik heb een video voor je opgenomen die je laat zien:

- hoe een nieuw AI aangestuurde zoekmachine Google naar de kroon steekt,
- een uitleg geschreven wat deze ontwikkeling voor jouw website betekent
- wat je moet doen op sociale media
- welke content je moet maken


>