Human History According to AI
Vélaframleidd skrá yfir 5.226 ár af mannkynssögunni
Python-þjónn og Claude API-lína sem myndar skipulægt JSON-gagnasafn yfir öll 5.226 ár skráðrar mannkynssögu — með heimildum, öryggisstigum og skjalfestum eyðum.
“Sigurvegararnir skrifa söguna — en skipulagður þekkingargrunnur verður að gera grein fyrir öllum öðrum.
Áskorunin
Skipulagð, vélaalesanleg söguleg þekking í stórum stíl er ekki til. Alfræðilegar heimildir eru skrifaðar fyrir mannlega lesendur og þola ekki fyrirspurnir í stórum stíl. Ekkert staðlað snið fangar öryggigstig, orsakatengsl og skjalfæstar eyður sem nákvæm söguleg rökhugsun krefst. Að byggja 5.226 ára gagnasafn handvirkt myndi taka áratugi; að gera það af gáleysi með gervigreind myndi framleiða hrikalegar staðhæfingar.
Nálgunin
Hannaði ICCRA-skemað — JSON-snið sem krefst heimildatilvísana, öryggisstiga (staðfest, líklegt, áætlað, hefðbundið, þjóðsagnakenndar), orsakatengla og beinnar yfirlýsingar um landfræðilegar eyður fyrir hvert ár. Smíðaði Python async-þjónn sem kallar á Claude Sonnet 4.6 í gegnum Anthropic API, staðfestir úttak gegn skemanu, skráir framvindu í skráningarbók án eyðingar og nær sér eftir bilanir án gagnamissis. Náði 99% kostnaðarlækkun með því að nota API beint í stað þriðja aðila millilags.
Niðurstöður
Um verkefnið
Human History According to AI er sjálfvirkt rannsóknarkerfi sem myndar skipulagða, vélaalesanlega mannkynssögu — ár fyrir ár, frá 2025 e.Kr. aftur til um 3200 f.Kr. Hvert af 5.226 árunum fær sitt eigið JSON-skjal, útfyllt af Claude Sonnet 4.6 í gegnum Anthropic API.
Þetta er ekki frásagnarsaga. Þetta er þekkingargrunnur hannaður fyrir gagnagröf, tímalínur, gagnrýna endurskoðun og frekari rök með gervigreind. Sérhver atburður tilgreinir heimildir sínar, lýsir öryggistigi og birtir gagnkvæmar gögn þar sem þær eru til.
Af hverju þetta verkefni?
Söguleg þekking er til í gnægð en er óskipulögð. Núverandi heimildir — alfræðiorðabækur, fræðigreinar, Wikipedia — eru skrifaðar fyrir mannlega lesendur: frásagnarlegs eðlis og erfiðar að fyrirspurna í stórum stíl. Þetta verkefni spyr annarrar spurningar: hvernig lítur skipulagður, vélaalesanlegur grunnur mannkynssögunnar út?
Svarið er ICCRA-skemað — JSON-snið sem fangar atburði, orsakatengsl, landfræðilegar upplýsingar, öryggigstig og beinan yfirlýsingu um hvað við vitum ekki. Reiturinn fyrir landfræðilegar eyður er ekki hugsunarleysis vegna: hann er meðvituð viðurkenning þess að skjalaleg gögn dreifast ekki jafnt yfir mannkynið.
Uppbygging kerfisins
Kerfið er Python async-þjónn sem stýrir API-köllum, heldur utan um framvindu í skráningarbók án eyðingar, staðfestir úttak gegn ICCRA-skemanu og nær sér eftir bilanir. Next.js 16-viðmót veitir gagnvirka tímalínumynd af gengnum gögnum.
Verkefnið náði 99% kostnaðarlækkun með því að flytja frá þriðja aðila samskeytingarlag yfir í bein Anthropic API-köll með runuvinnslu — breyting sem gerði viðvarandi, langtímavinnslu hagkvæma.
Öryggigstig
Sérhver söguleg staðhæfing í gagnasafninu er merkt með einu af fimm öryggistigum:
- Staðfest: Frumheimildir, líkamlegar sannanir, margar óháðar staðfestingar.
- Líklegt: Sterk óbein eða afleidd gögn.
- Áætlað: Almenn fræðileg samstaða, ónákvæm tímasetning.
- Hefðbundið: Varðveitt í menningarminninu en ekki óháð staðfest.
- Þjóðsagnakennt: Goðsagnakenndar frásagnir — teknar með í heildarmyndina, skýrt merktar.
Þetta stigskipulagðar kerfi þýðir að hægt er að fyrirspurna gagnasafnið eftir þekkingarfræðilegum gæðum, ekki bara eftir dagsetningu eða svæði.
Landfræðilegar eyður
Einn mikilvægasti reiturinn í skemanu er bein yfirlýsing um landfræðilegar eyður í skráningu. Fyrir hvert ár er þjónninum gert skylt að tilgreina hvaða svæði og þjóðir eru of fáskráðar — ekki vegna þess að sagan gerðist ekki, heldur vegna þess að eftirlifandi heimildir fanga hana ekki. Þetta er viðurkenning innbyggð í uppbyggingu gagnanna, ekki falin í fyrirvörum.
Framvinda
Í apríl 2026 hefur þjónninn lokið 1.160 af 5.226 árum — um það bil 22% af heildargrunninum. Árin eru unnin í öfugri tímaröð, þannig að nýleg saga (þar sem heimildir eru gleggstar og auðveldast að sannreyna) kom fyrst. Gögnin eru opin og skipulögð fyrir beinan innflutning í gagnagröf eða tímalínuverkfæri.
Verkefnið er opinn hugbúnaður. Framlag, gagnrýni á skemað og andstæðar endurskoðanir á mynduðu efni eru velkomin.
Tæknistaflinn
Tenglar og heimildir
Lærdómar
- Gervigreindarbúið sögulegt efni krefst beinnar merkingar á óvissu innbyggðrar í gagnaskemað. Án yfirlýstra öryggistiga les úttakið sem óskoruð sannleikur þegar það ætti ekki að gera það.
- Landfræðilegar eyður eru eiginleiki, ekki galli. Að gera þær að nauðsynlegum skemarel þvingar heiðarlega skráningu á því sem heimildasafnið fangar og fangar ekki.
- Skráningarbók án eyðingar er rétt mynstur fyrir langtíma gervigreindarvinnslu — hún gerir ferlið endurræsanlegt, endurskoðanlegt og kostnaðarfyrirsjáanlegt.
- 99% kostnaðarlækkun með beinum API-aðgangi í stað þriðja aðila millilags breytir því hvað er hagkvæmt í gervigreindarrannsóknum. Innviðaval hefur rannsóknarsviðsleg afleiðingar.
- Öfug tímaröð í vinnslu er rétt — byrjaðu á árunum þar sem hægt er að sannreyna gæðin áður en tekið er á fornöld þar sem staðfesting er erfiðari.