Kannattaako yrityksen DAM mediapankissa hyödyntää koneoppimista kuvantunnistuksessa?

27. helmikuuta 2018

Tekoälyn (AI) ja koneoppimisen käyttäminen sisällön hallinnan automatisointiin on lupaava. Olemme arvioineet eri kuvantunnistuksen AI-tarjoajia tänä vuonna ja havainneet, että nämä tekniikat ovat viimeinkin kypsiä ja hyödyllisiä - jos niitä käytetään oikealla tavalla.

Tutustu tekoälypohjaiseen kuvantunnistukseen

Mediapankeissa tiedostot ovat yllättävän usein huonosti kuvattuina, vaikka kenttiä ja tilaa kuvausinformaatiolle on riittävästi ja sisällön rakenteet ovat kunnossa. Tämä taas johtuu siitä, että metatietojen lisääminen on usein hankalaa ja oikeiden kuvauksien löytäminen ei kaikilta noin vain onnistu.

Jotkut DAM mediapankkien toimittajat ovat integroineet rajapinnan kautta järjestelmiinsä yhden tai useamman AI-kuvantunnistussovelluksen. Myyjät usein mainostavat näitä työkaluja täydellisinä automaatioratkaisuina, joiden ansiosta käyttäjien ei enää tarvitse manuaalisesti syöttää kuvatunnisteita luetteloinnissaan.

Annetaan ymmärtää, että kuvantunnistuksen automaatiot ovat kuin toiset aivot DAM-sovellukselle. Kuvantunnistus voi siis auttaa sinua tekemään tägäyksiä, joita et halua tai joita et voi tehdä ja johon ei ole aikaa. Onko näin?

Ratkaisua myydään usein sillä, että automaattinen kuvantunnistus säästää valtavan määrän henkilötunteja luettelointivaiheessa tiedostojen avainsanoituksessa ja kuvauksissa. 

Tavallisissa kaupallisissa kuvapankkikuvissa kuvantunnistus toimii melko hyvin, mutta yrityskohtaisissa sovelluksissa yleiset tunnistekirjastot eivät ole riittävän tarkkoja kuvaamaan haluttua kohdetta ja tarjoavat tavallaan turhaa informaatiota. Näillä lisätyillä hakusanoilla haut aineistopankissa eivät välttämättä parane.

Mielestäni kuvantunnistus voisi auttaa käsittelemään etenkin kohdennettuja metatietohaasteita, mutta nykyiset yleiset ja muodissa olevat kuvantunnistusalgoritmit eivät aina tuota haluttua lopputulosta tai paranna yrityksen DAM-sovelluksen toimintaa sellaisenaan.

Vaikka kuvantunnistus tarjoaa kuvaavaa metatietoa (eli miltä jokin näyttää yleiseltä kannalta), on se metatietojen laadun kannalta heikko lähde, koska useimmat yritysasiakkaat tarvitsevat heidän tarpeisiinsa optimoidut hakusanat omien digitaalisten tiedostojen löytämiseen.

Tekoälyavusteisen tägäyksen kohdalla avainsanan tuottaminen sisäisessä käytössä on sikäli ongelma että, tekoäly ei tiedä, mitä institutionaalisia tietoja on lisättävä tiedostoon. Automaattinen avainsanoitus, joka perustuu organisaation omiin nimikkeisiin DAM: in sisällä (kuten esim. kategoria tai kokoelma), ovat lähempänä tarkkaa tunnistetta. 

Nykyiset AI-kuvantunnistusalgoritmit keskittyvät kokonaan tiedostojen binääritietoihin. Yrityksen sisäisessä käytössä vaaditaan kuitenkin linkitystä yrityksen omaan taksonomiaan sekä kontekstiin. Pitää siis luoda omat kuvantunnistekirjastot, jotta kuvantunnistus tuottaa haluttua avainsanoitusta eikä vain ylimalkaista sellaista. Jos kenkämyyjä saa tietää, että kaikki kuvat sisältävät kenkiä ei hän siitä hyödy mitenkään.

Sitä tarkemmin rajattu ja kohdistettu kirjasto on käytössä, sen tarkemmat ovat ennusteet kuvantunnistukselle. Tätä algoritmia kannatta kehittää ja jatkojalostaa palvelemaan yritystä yhä paremmin. Lisäksi algoritmi paranee itsestään lisäaineistolla eli datalla.

Ja kyllä, tekoäly auttaa osittain lievittämään luokittelun raskasta taakkaa, mutta se on edelleen vain työkalu. Keinoäly, tekoäly, koneoppiminen (AI), on yhä lähempänä 
näiden ongelmien ratkaisemista. Jokainen työkalu vaatii kuitenkin ihmisen valvontaa, ylläpitoa ja resursseja - ja sanakirjojakin on edelleen ylläpidettävä.

Ajattele tekoälyä uutena nuorena toimistotyöntekijänä. Hän ei ole kovin perehtynyt juuri siihen, mitä sinä tai yrityksesi tarpeesi ovat, joten tarvitset kokoaikaisen hallinnan ja valvonnan uudelle työntekijällesi. AI-teknologian tehokas käyttö vaatii enemmän kuin yksinkertaisesti kolmansien osapuolten sovellusratkaisun liittämistä sovellukseen.

Jotta saat parhaan mahdollisen hyödyn, sinun on käytettävä aikaa konsultoimalla, räätälöimällä ja mukauttamalla kuvatunnistustyönkulkuja kohdekäyttöön sopivalla tavalla, muuten tulokset eivät optimoitu riittävästi tuottamaan haluttua lisäarvoa. DAM-myyjät eivät useinkaan mainitse asiaa, eivätkä välttämättä ymmärrä  asiakkaan linkitystarvetta.

Nyt on kuitenkin digitaalisia tiedostoja liikkeessä yksinkertaisesti liikaa eri muodossa ja volyymit kasvavat eksponentiaalisesti ajan myötä. Jossain vaiheessa on välttämätöntä siirtää metatietojen syöttö muille kuin itse työntekijöille ja vaihtoehtoisesti etsiä tekoälyavusteisia automaatiostrategioita.

Kuvantunnistus oikein käytettynä parantaa digitaalisen aineiston hallintaa ja tiedon käytettävyyttä yrityksissä ja organisaatioissa, säästää aikaa ja rahaa ja samalla tekoäly auttaa käyttäjiä löytämään oikeat kuvat ja tiedostot nopeammin.

Lue lisää pikaoppaastamme miten käytät kuvantunnistusmalleja sekä kuvantunnistuksen hyödyistä tästä:

Lataa Opas: Näin kuvantunnistus parantaa mediapankin sisältöä

Tutustu tekoälypohjaiseen kuvantunnistukseen

Kirjoittaja Rolf Koppatz

Rolf on Communication Pro:n perustaja ja toimitusjohtaja, DAM konsultti, markkinoinnin sekä IT-alan ammattilainen 35 vuoden kokemuksella.

Sano hei, vaikka LinkedInissä.

www.communicationpro.com