Tenhle týden mě na procházce se psem po čase opět praštilo do očí, jak příšerně nudná jsou consumer spec auta. Pět identických hatchback krabic ve čtyřech odstínech šedi.

Vzpomněl jsem si u toho na tento Reddit příspěvěk z roku 2020. Jeho autor (before it was cool) scrapnul obsah polských auto inzertních serverů:
I scraped over 3.5m car offers (used and brand new) from polish websites for the past three years. I used python for data aggregation, processing, cleanising and visualization (plt).
A z dat vytvořil skvělou vizualizaci, o tom jak z aut postupem času mizí barva (ne, není to jen váš pocit).

Napadlo mě u toho, že by se za pomoci nového ChatGPT-4o multimodálního modelu dala udělat podobná vizualizace o českém vozovém parku. S podobně (ne)kvalitními daty, které by ale v průměru měly udělat alespoň trochu reprezentativní obrázek o tom, jaké barvy aut se v průběhu let pohybují po českých silnících.
Moje teorie byla taková, že vyberu ~10 náhodných veřejných parkovišť, a nafotím je za pomoci stroje času na Mapy.cz, nasypu je do ChatGPT a nechám spočítat jednotlivé vozy + jejich barvy. Vytvořila by se tak “databáze” o tisícovkách aut mezi lety 2004 a 2021.

Na test jsem vybral hezky čistý, jasně čitelný a nečlenitý sektor parkoviště z Mladé Boleslavi:

Výsledek byl dost tristní:

Manuální počty jsou:
- červená 24
- modrá 4
- bílá 42
- černá 25
- stříbrná 11
- oranžová 1
Po tomto mi rychle došlo, že se žádné grandiózní vizualizační plány neuskuteční, a už jsem se rozhodl model jen zkoušet. Tady je sektor z parkoviště před IKEA Zličín, ve kterém jsem robota poprosil o vyznačení bílých aut:

Kromě parkoviště na nákupní vozíky označil jako bílá auta i čtyři pruhy na přechodu pro chodce, ale jinak vynechal pouze jeden vůz (a to ještě částečně zakrytý stínem). Větší problém evidentně nastane, když má ChatGPT počítat: z 21 vozů (nebo 27 vyznačených sektorů) udělal aut 39.
Méně slavně si vedl i při dotazu na vyznačení všech ostatních barev:

Což byl moment, kdy jsem robota přestal týrat, a nechal ho dělat to, co mu jde nejlíp. Náhledové obrázky k článkům:

Pokud vás zajímá, jak to s mizejícími barvami ve skutečnosti je, nejaktuálnější je “studie” od amerického srovnávače inzerátů iSeeCars. Ta tvrdí, že 80 procent nových aut je ve čtyřech odstínech šedi. V analýze se ale například ani nedočtete z jakého trhu data pocházejí (server je ze Spojených států, tak předpokládejme, že data pokrývají USA), takže bych bral data s rezervou. Podle Deníku.cz je stav v ČR ještě o 6 procent horší – bílou, šedou, stříbrnou nebo černou tu má 86 procent vozů.
A na závěr moje kudos čtyřem procentům čechů, kteří se rozhodli jezdit v hnědém autě.
02-06-2024