Czy wiesz, od czego zależy skuteczność uczenia maszynowego? Jednym z najważniejszych elementów
tego procesu jest odpowiedni zbiór danych uczących. Problem w tym, że zebranie dobrej jakości
danych jest kosztowne, przez co często takie zbiory są niepełne. Jak sobie z tym radzić? Z pomocą
przychodzą metody active learningu, dzięki którym algorytmy uczenia maszynowego są w stanie
uzyskiwać większą dokładność pomimo mniejszej ilości danych uczących. Sprawdźmy, czym dokładnie
jest active learning i jakie korzyści wynikają z jego wykorzystania.
Czym jest i jak działa active learning?
Active learning to szczególny rodzaj uczenia maszynowego. U podstaw tego procesu leży założenie,
że algorytm uczenia maszynowego jest w stanie osiągać wyższy poziom dokładności przy mniejszym
zbiorze danych uczących, o ile może samodzielnie wybierać, na których danych chce się uczyć.
Z kolei wybór najlepszych zbiorów danych jest możliwy dzięki mierze informatywności
(informativeness measure). Jest to miara, która pozwala na ocenę stopnia informacyjności lub
użyteczności zasobów. Następnie zasoby, którym została przypisana wysoka wartość
informatywności, są wybierane jako kandydaci do oznaczenia przez eksperta.
W praktyce wygląda to tak, że algorytmy sztucznej inteligencji w procesie uczenia się interaktywnie
wysyłają zapytania do użytkownika (lub innego źródła), w celu zdobycia pożądanych informacji na
temat wybranych przez siebie danych.
W rezultacie proces uczenia maszynowego jest skuteczny pomimo minimalnego wysiłku
etykietowania danych.
Metody i zastosowania active learning
Algorytmy w ramach active learning wykorzystują do nauki 3 podstawowe metody:
- stream-based selective sampling,
- pool-based sampling,
- membership query synthesis.
Metoda stream-based selective sampling polega na tym, że wybrane przez algorytm dane są
oceniane jedne po drugich. Za każdym razem, gdy algorytm poprawnie zidentyfikuje dane, żąda dla
nich etykiety. Z tego powodu metoda ta wymaga dużego zaangażowania człowieka w proces uczenia.
W przypadku pool-based sampling początkowo oceniany jest cały zbór danych lub jego wybrana
część, w ten sposób algorytm sprawdza, czy określone dane będą przydatne dla rozwoju modelu. To
podejście jest bardziej wydajne od poprzedniego, ale wymaga dostępu do dużej mocy obliczeniowej i
pamięci.
Natomiast metoda membership query synthesis polega na tym, że algorytm generuje własne
hipotetyczne dane. Z tego względu metoda ta wykorzystywana jest tylko w niektórych scenariuszach,
w których możliwe jest wygenerowanie wiarygodnych danych.
Proces active learning może być wykorzystywany praktycznie we wszystkich dziedzinach sztucznej
inteligencji. Przykładem jest chociażby computer vision. W tym przypadku active learning sprawdza
się ze względu na ogromną ilość nieoznakowanych danych, jakie dostępne są w internecie.
Korzyści płynące z active learning
Active learning zakłada, że nie wszystkie dostępne dane są równie ważne dla algorytmu w procesie
uczenia się. Jednocześnie ręczna selekcja takich danych jest czasochłonna, kosztowna i po prostu
niepraktyczna.
Z kolei losowy dobór danych do uczenia się może sprawić, że otrzymamy model o niskiej jakości.
Właśnie z rozwiązaniem takich problemów bardzo dobrze radzi sobie active learning.
Dzięki temu, że algorytm samodzielnie wybiera dane, z których najlepiej będzie się uczył, sam proces
uczenia staje się szybszy, a do tego poprawia się jakość niektórych modeli opartych na NPL czy
computer vision i zmniejszają się koszty związane z oznaczaniem danych. A to pozwala na bardziej
efektywne wykorzystanie uczenia maszynowego w różnych dziedzinach.
Podsumowanie i źródła
Prace nad active learning skupiają się na tym, aby algorytmy były w stanie uczyć się na mniejszej
liczbie oznaczonych danych uczących, jednocześnie zachowując wysoką jakość predykcji. Docelowo
wydajność uczenia modelu powinna być zbliżona lub wręcz ma przewyższać możliwości tradycyjnego
uczenia nadzorowanego.
Jednocześnie warto zauważyć, że active learning nie jest rozwiązaniem uniwersalnym i wymaga
odpowiedniego zrozumienia problemu oraz odpowiedniego dobrania miar informatywności. Dobrze
przemyślane podejście do projektowania strategii active learning jest kluczowe dla uzyskania
optymalnych wyników.