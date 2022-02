Clive Humby, przedsiębiorca i matematyk, pewnego razu powiedział, że dane to nowa ropa naftowa. Stwierdzenie miało sugerować, że informacje stały się najcenniejszym zasobem, spychając czarne złoto na drugie miejsce. Kilka lat później dyrektor finansowa Google, Ruth Porat, odniosła się do tych słów, twierdząc, że dane można porównać raczej do energii słonecznej – używamy ich bez przerwy, a one tak jak słońce nieustannie się regenerują.

Abstrahując od sposobu pozyskiwania, jedno jest pewne – ani ropa, ani promienie słoneczne nie będą użyteczne, dopóki nie zostaną poddane odpowiednim procesom. Podobnie jest z danymi. Samo posiadanie surowych liczb nie przełoży się na zysk – ale umiejętna ich obróbka, analiza i wyciąganie wniosków już tak.

Spotykaliśmy się z takimi problemami, że firmy prowadziły całościową analizę danych, ale proces nie był efektywny z powodu niewydolnej infrastruktury. Pomimo dobrej konstrukcji, prowadzenie analizy wciąż było uciążliwe i zajmowało za dużo czasu. Budowa hurtowni danych z użyciem usług Google Cloud Platform pozwoliła zwiększyć wydajność, niektórym nawet kilkudziesięciokrotnie, skracając też czas zwracania wyników z godzin do minut czy sekund – mówi Bartosz Szymański, Head of GCP Sales w FOTC.

Jeśli chcesz dowiedzieć się jak wyciągnąć cenne biznesowe wnioski z masy suchych informacji, to zarejestruj się na spotkanie online “Biznes oparty na danych w chmurze”. Podczas wydarzenia na wirtualnej scenie gościć będą inżynierowie chmurowi, m.in. z FOTC czy Google Cloud, którzy opowiedzą, jak kolekcjonować i przetwarzać dane w przedsiębiorstwach, by podejmować decyzje poparte twardymi danymi. Więcej informacji o wydarzeniu znajduje się na końcu artykułu.

Bezmyślna analiza danych, czyli…

Powszechnie już wiadomo, że nie można ulepszyć czegoś, czego się nie mierzy. Wiele firm kolekcjonuje więc przeróżne dane czy pracuje z użyciem KPIs. Procesy są opomiarowane, ale problem pojawia się na etapie ulepszeń. Optymalizacje, zamiast w całości, są prowadzone w oddzielonych od siebie obszarach, bo brakuje spojrzenia na liczby z szerszej perspektywy.

Dane mogą – a nawet powinny – pochodzić z różnych źródeł. To mogą być wypowiedzi użytkowników na temat produktu w mediach społecznościowych; informacje o zachowaniu na stronie internetowej, liczbie odsłon, głębokości czy długości sesji; liczba i waga zgłoszeń klienckich, reklamacji czy rezygnacji z usługi; dane z kadr o wydajności i retencji pracowników; informacje księgowe o poziomie i rodzaju kosztów oraz przychodów.

Błędem jednak jest trzymanie tych informacji w osobnych systemach. Silosy danych mogą wydawać się nieszkodliwe, ale są barierą w kwestii wymiany danych oraz współpracy w organizacji. Zdarzają się też nieścisłości – liczby w bazach poszczególnych działów mogą diametralnie się różnić. Każdy obszar musi być też z osobna aktualizowany, co oznacza, że nie każdy pracownik może mieć dostęp do najnowszych danych.

Jak prawidłowo prowadzić analitykę danych w firmie?

Te informacje i liczby, zamiast przechowywać w osobnych programach czy plikach, można zamieścić w hurtowni danych. Hurtownia danych to system, który pozwala w jednym miejscu agregować, przetwarzać i zestawiać ze sobą dane pochodzące z różnych źródeł. Daje to możliwość namierzenia zależności między pozornie oddalonymi od siebie segmentami przedsiębiorstwa.

System można zbudować na własnej infrastrukturze, ale można też skorzystać z gotowych usług chmurowych, co przełoży się na szybszą budowę hurtowni i wygodniejszą jej obsługę. Google, jako jeden z prowadzących dostawców usług chmurowych w kwestii usług analizy Big Data, oferuje na platformie Google Cloud Platform zarządzane środowisko z dużymi możliwościami automatyzacji procesów, które daje więcej przestrzeni na analizę danych zamiast na prowadzenie prac utrzymaniowych. Pamiętając też o słowach Ruth Porat o danych jako energii słonecznej, warto wspomnieć, że korzystanie z infrastruktury GCP zmniejsza ślad węglowy firmy – obecnie większość regionów jest zasilanych przez elektrownie wiatrowe, a Google realizuje plan, by do 2030 roku korzystać wyłącznie z odnawialnych źródeł energii.

Porównanie nakładu pracy potrzebnej na utrzymanie tradycyjnego systemu hurtowni danych oraz hurtowni danych zbudowanej z użyciem bezserwerowych usług chmurowych. Grafika na podstawie wystąpienia Sadhira Hasbe “Rethinking business through data” podczas konferencji Cloud Next’19.

Warto mieć też na uwadze pojęcie demokratyzacji danych, czyli przedstawienia ich w sposób przystępny dla końcowego odbiorcy. Tworząc system analizy w chmurze Google, jako ostatni element można zaangażować narzędzie wizualizacji danych – Data Studio, Lookera czy Tableau. Statystyki przedstawione na interaktywnych wykresach będą łatwiejsze do odczytania przez pracowników niż wyniki w języku SQL, a możliwość generowania własnych raportów pozwoli sięgać do systemu po dane potrzebne do usprawnienia codziennych prac. Równolegle specjaliści Business Intelligence będą mogli skupić się na prowadzeniu zaawansowanych analiz, zamiast poświęcać czas na wspieranie każdego pracownika w pobieraniu czy odczytywaniu danych.

Przykład prezentacji danych w programie wizualizacji Looker. Źródło: artykuł Google “5 ways the new Looker dashboards make it easier to explore data“

Wydarzenie “Biznes oparty na danych w chmurze” organizowane przez FOTC 24 lutego 2022 roku odbędzie się wydarzenie online “Biznes oparty na danych w chmurze”, organizowane przez polskiego partnera Google Cloud – firmę FOTC. Podczas spotkania wystąpi trzech specjalistów ds. analizy danych: ●Stanisław Magierski, Customer Engineer w Google Cloud, opowie, jak wykorzystać potencjał danych, zarządzać nimi i skalować analitykę biznesową, ●Marcin Kolenda, Chief Analyst w Alterdata.io, podzieli się doświadczeniami z użycia usługi BigQuery ML podczas prelekcji “Budowa hurtowni danych na GCP – okiem praktyka“, ●Tomasz Karsznia, Data Engineer w FOTC, zaprezentuje sposób analizy logów przy użyciu BigQuery oraz Data Studio na przykładzie danych z pakietu aplikacji biznesowych Google Workspace. Po wystąpieniach przewidziany jest panel Q&A, podczas którego specjaliści odpowiedzą na pytania związane z prowadzeniem analizy danych w chmurze. Na wydarzenie można zarejestrować się poprzez formularz na stronie: “Biznes oparty na danych w chmurze”.