08.05.2024
Tämän hetken kuumimpia puheenaiheita on tekoäly ja se on näkynyt myös meillä BSTR:llä. Olemme tutkineet ja tutustuneet erilaisiin tekoälyn soveltamismahdollisuuksiin, joita olemme sittemmin myös hyödyntäneet asiakastöissä.
Ohjelmistoyritys River IT:lle loimme tekoälyllä hieman tavallisuudesta poikkeavan QR-koodin, jossa perinteisten mustavalkoisten ruutujen sijasta QR-koodin muodosti robotin hahmo. Tässä blogissa vinkkejä ja huomiotamme matkan varrelta.
Ensinnäkin projektiin tarvittiin Stable Diffusionin, avoimen lähdekoodin kuvaa luova tekoälysovellus.
Sovellus saatiin asennettua Macille, Pythonin ja muutaman muun avustavan paketin latauksen jälkeen. Käyttöliittymänä kuvaa luotaessa toimii Automatic 1111 jossa itsessään pystyy jo luomaan kuvia melko näppärästi. Mallina realistista kuvaa tuottava malli ja teknisiin laitteisiin ja robotteihin erikoistunut lisäosa.
Seuraavaksi tarvitaan lisäosa Control Net. Tällä sitten pystytään kontrolloimaan mitä kuvaan halutaan. Esimerkiksi juurikin QR-koodi. Jotta QR-koodista saa vielä paremmin lukukelpoisen, tarvitaan vielä yksi lisäosa, QR Code Monster, joka varmistaa että koodia pystyy lukemaan paremmin.
Kun ohjelmistot ja lisäosat ovat hallussa ei muuta kuin testaamaan!
Käytännössä huomattiin jo heti alussa, että QR-koodin osoite ei voi olla kovin pitkä. Muuten koodiin tulee liikaa pikseleitä ja on kuvaksi muutettaessa helposti lukukelvoton.
Kuvaa, jota QR-koodin taustalle haluttiin, ei oltu määritelty kovin tarkasti. Asiakkaan toiveissa oli ohjelmistorobotiikkaan ja automatisointiin liittyvää kuvamaailmaa.
Testausvaiheessa kuvien aiheeksi heiteltiin mitä tahansa mieleen juolahti, ja kokeiltiin syntyykö luettavan koodin ja näyttävän kuvan yhdistelmää.
Melko näyttäviä kuvia saatiin aikaiseksi kun teemaksi laittaa 1800-luvun maalauksen ja teollisuuden. Promptia, eli halutun lopputuloksen kuvailua, olisi pitänyt hioa aika pitkään, jos tämän vaihtoehdon olisi ottanut.
Teollisuutta 1800-luvulla tekoälyn tulkitsemana
IT-toimisto, 1800-luku, tyylisuuntana kubismi
Jos taas kuvaan halusi ihmisiä, niin tekoäly iloisesti väänteli raajoja hiukan hassuihin asentoihin, sekä sitten laitteli pieniä ylimääräisiä käsiä tarttumaan eri paikoista kiinni. Ei ehkä helpoin mainoskuva tämäkään.
IT työskentelijä renesanssin maalauksessa I, tekoäly lisäillyt hauskoja ylimääräisiä pikku käsiä mukaan
IT työskentelijä renesanssin maalauksessa II, täälläkin muutamia ekstra sormia taskussa
Tyhjistä toimistokuvista tuli melko uskottavan näköisiä, ehkä vain vähän tylsiä.
Robottiaiheisista kuvista sen sijaan alkoi tulla jo melko näyttävän näköisiä. Qr-koodi myös sulautui uskottavasti kuvaan sisään.
Kliininen moderni toimisto
Robotteja tulevaisuuden maisemissa, tästä lähdettiin jatkokehittämään. Värimaailmassa jäljitelty River IT:n brändin värejä
Koodeja luodessa kuvia tehtiin kerralla noin 30. Aikaa tekoälyllä kuvajoukon luomisessa kesti noin 45 min. Näistä kuvistä n. 40 % kuvista QR-koodi oli lukukelpoinen.
Stable Diffusion Macillä ei ole niin tehokas kuin PC:llä mutta toimii kuitenkin siedettävästi.
Koodin saaminen lukukelpoiseksi vaati jonkin verran säätämistä: Kolme eri Control Net -moduulia hiukan eri asetuksilla, jotta koodit ovat luettavissa.
Asetusten kanssa oli tasapainoilua, jos QR-koodille laittoi liian paljon painoa, koodi ei sulautunut kuvaan kunnolla, eikä kuva oikein esittänyt mitään. Jos taas painoarvo oli liian vähän, ei koodi ollut lukukelpoinen ollenkaan.
Muutama kierros jouduttiin tekemään vielä kun hyvännäköiseen robottikuvaan oli päästy. QR-koodin luova sivusto lyhensi osoitteen bit.ly muotoon, joka ei kerro minne käyttäjä oikeasti päätyy ja näin ollen saattaa herättää epäilyksiä.
Seuraavan kierroksen robottikuva, taustalla futuristista kaupunkia. QR-koodin osoitteena lyhennetty bit.ly osoite
Tämän jälkeen tehtiin vielä kuvat oikealle landing-sivustolle, mutta huomattiin että tarvitaan vielä www -alku koodiin, jotta QR-koodin kautta pystyttiin seuraamaan kuinka moni sivustolle saapuu.
Toiseksi viimeinen kierros kuvia, QR-koodista vain puuttuu www. alusta
Tekoälyllä luoduissa kuvissa on vain se sattumanvaraisuus, jos mikä tahansa asetuksista muuttuu, ei lopputulos ikinä ole täsmälleen samanlainen. Kun QR-koodia vaihdetaan, pitää kaikki kuvatkin luoda uudestaan, mutta täsmälleen aikaisemman kaltaista lopputulosta ei todennäköisesti saada aikaiseksi.
Vastaava kuva kuitenkin saatiin aikaiseksi, jota sitten skaalattiin ylöspäin että saatiin A5 kokoista mainosta varten tarpeeksi pikseleitä. Lopputulosta varten vielä jatkettiin kuvaa pituussuunnassa, lisättiin mainostekstit ja saatiin ulos valmis työ!
Lopullinen versio mainostekstin ja logon kanssa
[UUTISKIRJE]
Jaamme parhaat vinkkimme, oivalluksemme ja onnistumisemme noin kerran kuukaudessa.