Podejście do projektów danologicznych (Data Science): przygotowanie, analiza i rozwój aplikacji oraz ocena i utrzymanie
Danologia przemysłowa (Industrial Data Science) to całkiem nowa dyscyplina. Dotychczas nie powstało ogólnie obowiązujące podejście, które byłoby odpowiednie dla każdej firmy. Każde rozwiązanie i wszystkie poszczególne zastosowania wymagają analizy i modelowania danych pod kątem indywidualnego przypadku, aby osiągnąć najlepsze możliwe rezultaty. Jednakże na początku można zastosować standardowe podejście, które jest bardzo przydatne. Najczęściej wdrażany wzorzec to MODEL CRISP-DM (ang. Cross-Industry Standard Process for Data Mining, międzybranżowy standardowy proces pozyskiwania danych). Firma OMRON uprościła i dostosowała model CRISP-DM do nowego podejścia. Cztery etapy tego podejścia to przygotowanie, analiza i rozwój aplikacji oraz ocena i utrzymanie. Więcej informacji na temat tych etapów można znaleźć w infografice.
Etap 1: Przygotowanie
Etap przygotowania jest najważniejszy. Projekt danologiczny nigdy nie zakończy się sukcesem, jeśli jego cel jest niejasny. W związku z tym ważne jest, aby na pierwszym etapie wszyscy uczestnicy i eksperci najpierw skoncentrowali się na problemie lub konkretnym wymogu w celu osiągnięcia jasno określonego celu projektu. Muszą szczegółowo przeanalizować maszynę i/lub proces produkcji, aby wiedzieć, jakie dane są już dostępne, a jakie nadal muszą zostać pozyskane. W tym procesie wstępny zestaw danych może być pozyskiwany i analizowany jako rodzaj studium wykonalności. Na końcu etapu przygotowania tworzony jest raport, który zawiera informacje na temat oczekiwanej wygenerowanej wartości i rzeczywistego zwrotu z inwestycji.
Etap 2: Analiza i rozwój aplikacji
- Gromadzenie danych: dane są gromadzone z różnych źródeł — od nieprzetworzonych danych czujnika do informacji z systemów MES.
- Wstępne przetwarzanie danych: zebrane dane są przygotowywane do etapu analizy, przekształcane, łączone i oczyszczane.
- Analiza danych: stosowane są opracowane algorytmy analizy i modele uczenia maszynowego.
- Zastosowanie: udostępniane są wyniki i wnioski z analizy danych, na przykład w formie wizualizacji dostosowanych do sytuacji lub grupy docelowej albo informacji zwrotnych wprowadzanych do maszyny.
Etap 3: Ocena
Aplikacja jest używana w środowisku produkcyjnym, oceniane są skuteczność i wyniki biznesowe. Jeśli skuteczność nie spełnia oczekiwań, należy powtórzyć poprzednie etapy projektu.
Etap 4: Serwisowanie i utrzymanie
Procesy produkcyjne i działanie maszyny również mogą się nieustannie zmieniać, na przykład z powodu wprowadzania aktualizacji lub zużycia eksploatacyjnego. W związku z tym konieczne jest regularne ponowne zatwierdzanie rozwiązania, aby mieć pewność, że jest dostosowane do rzeczywistych parametrów procesu i działa z odpowiednią skutecznością. Ponadto ilość dostępnych danych rośnie i często można opracować lepsze modele. W związku z tym istniejące modele (uczenie maszynowe) muszą być regularnie poddawane przeglądowi.
Przykład praktyczny: linia SMT
Rozwiązanie oparte na danych nie zawsze musi obejmować modne modele uczenia maszynowego lub sztuczną inteligencję. Czasami skuteczne przetwarzanie danych oraz dostarczanie właściwych informacji we właściwym czasie i we właściwy sposób może być wystarczające. Przykład takiego projektu danologicznego można znaleźć w aktualnym oficjalnym raporcie „Data Science Services by Omron – How to get the full value from your factory floor data (Usługi danologiczne firmy Omron – jak w pełni wykorzystać dane pozyskane z zakładu przemysłowego)”, który można pobrać bezpłatnie. Projekt został zrealizowany w zakładzie Omron Manufacturing of Netherlands (OMN) na liniach do montażu powierzchniowego (SMT), gdzie komponenty elektroniczne są montowane i lutowane na płytkach drukowanych (PCB).
Tylko najczęściej używane rozwiązania w pełni rozwijają swój potencjał
Rozwijanie potencjału wielkich zbiorów danych (Big Data) we własnym środowisku produkcyjnym nie jest łatwe, ale warto przyjąć taki cel. Nie wystarczy tylko zebrać dane i stworzyć kilka wykresów. Ważne jest odfiltrowanie z danych informacji istotnych dla produkcji i przedstawienie ich właściwym odbiorcom we właściwy sposób. Kluczem jest przekształcenie danych w użyteczne informacje. Wymaga to ścisłej współpracy naukowców i ekspertów specjalizujących się w procesach produkcyjnych. Dopiero wtedy będzie można opracować powszechnie i często używane rozwiązanie, które przyniesie długoterminowe korzyści.