Kuinka tehdä mallin kouluttamisesta ja uudelleenkoulutuksesta nopeampaa ja halvempaa? Suunnittelimme monikäyttöisen AutoML:n – tavoitteena luoda markkinoiden muita HPO-palveluita parempi ratkaisu.
Loimme uuden ratkaisun tekoälylle ja koneoppimiselle Techilan laskentaympäristöön.
Käytimme Bayesin optimointia, kaltevuutonta optimointia, satunnaista ja ruudukkohakua sekä vahvistusoppimista.
Laajensimme tuotteen monikäyttöiseen AutoML:ään, jossa on mustan laatikon optimointiominaisuudet.
Techila Distributed Computing Engine on seuraavan sukupolven laskentaverkko. Se on käyttäjäystävällinen ratkaisu, joka parantaa tuottavuutta tutkimuksessa, kehityksesä ja tuotantoympäristöissä käyttöön otettavissa sovelluksissa.
Tässä projektissa Techila halusi luoda laskentaympäristöönsä uuden ratkaisun tekoälylle ja koneoppimiselle. Yhdessä tunnistimme hyperparametrien optimoinnin potentiaaliseksi ehdokkaaksi. Datatieteilijämme työskentelivät osana Techilan tiimiä tavoitteenaan luoda markkinoiden muita HPO-palveluita parempi ratkaisu.
Tästä ideasta lähtien laajensimme tuotteen myös monikäyttöiseen AutoML:ään, jossa on mustan laatikon optimointiominaisuudet. Käytännössä se ottaa parametreja ja palauttaa pistemäärän, jota käytetään syöttöparametrien hienosäätöön. Datatieteen tiimit voivat käyttää ratkaisua välittömästi, mikä vähentää parametrien manuaalisen käsittelyn tarvetta. Tämä tekee mallikoulutuksesta ja uudelleenkoulutuksesta paljon nopeampaa, ja mikä tärkeintä, halvempaa.
Teknologiasta kiinnostuneille: käytimme muun muassa Bayesin optimointia, kaltevuutonta optimointia, satunnaista ja ruudukkohakua sekä vahvistusoppimista keksiäksemme huippuluokan ratkaisun. Työkaluista käytössä olivat esimerkiksi Scikit-Learn, CatBoost, XGBoost, LGBM, Keras/Tensorflow ja Pytorch.
Nämä onnistumiset ovat vain jäävuoren huippu. Muutetaan yhdessä ”mitäpä jos” tulevaisuudeksi, josta uskallamme unelmoida.
Ota yhteyttä