Data Craze Weekly #4

Tę wiadomość możesz otrzymać bezpośrednio na swoją skrzynkę dzięki zapisowi na newsletter – Data Craze Weekly.

Data Craze Weekly

Cotygodniowa porcja wartościowych informacji ze świata danych!
Inżynieria danych, analityka, how-to prosto do Twojej skrzynki.

    Zero spamu, 100% wartości.


    Administratorem danych osobowych niezbędnych w procesie przetwarzania, w tym podanych powyżej, jest Data Craze - Krzysztof Bury, ul. Piaski 50, 30-199 Rząska, NIP: 7922121365. Zapisując się na newsletter wyrażasz zgodę na przetwarzanie swoich danych osobowych (imię, e-mail) w ramach działań DataCraze.


    Formularz jest chroniony przez reCAPTCHA od Google Polityka Prywatności i Regulamin usługi.

    Przegląd Tygodnia

    Mit Self-Service BI

    Niczym jednorożec sunący po tęczy wielokrotnie słyszałem jak self-service BI naprawi całą korporacyjną analitykę.

    Self-service czyli oddanie analityki (możliwości tworzenia raportów / metryk etc.) w ręcę użytkowników jest świetną sprawą – co do tego nie ma wątpliwości.

    Jak zawsze jednak problem tkwi w szczegółach.

    Jeżeli nie zadbamy o jakość danych, monitorowanie narzędzia (ile raportów tworzą użytkownicy, jak często są używane, ile zajmują pamięci etc.), okresowe czyszczenie czy szkolenia z obsługi narzędzia, mogę z dużą dozą prawdopodobieństwa powiedzieć, że „Houston We have a problem.”

    Niestety nie ma magicznych sposobów na analitykę, jest za to pełno żmudnej pracy, która jak wykonana dobrze da świetne rezultaty.

    Cytując za autorką:

    In this case, Self-Service BI is not the golden ticket to solve all company’s problems, rather it’s a tool to enable the top-notch analytics.

    Link: https://analysiswithanh.medium.com/why-does-self-service-bi-fail-and-what-could-enterprises-do-to-turn-the-tide-a7e2e577cc9e

    SLA, SLO, SLI dla zespołów odpowiedzialnych za dane

    Być może znasz złoty standard w postaci 11-stu, 9-tek określających czy to dostępność czy trwałość usługi.

    A czy da się takie metryki odwzorować w świecie danych? Czy Twój zespół ma swoje SLA, SLO czy SLI? Czym te metryki są?

    Jeżeli klient zgłasza nam błąd w danych czy mamy jakiś proces, określający jak to naprawić? Czy jesteśmy w stanie dać informację jak długo zajmie naprawa?

    Czym to wszystko jest i jak wdrożyć takie tematy krok po kroku opisuje Xioaxu Gu w swoim artykule.

    Istotny jest fakt – nie ważne jak nazwiemy metryki czy procesy. Jeżeli nie sprawdzamy i nie mierzymy elementów procesu jako zespół to nigdy nie będziemy wiedzieć co idzie dobrze co źle i czy mamy coś do poprawy.

    You can’t improve what you don’t measure. As a mature data team, you should start thinking about data reliability from today. It’s not a hot topic in the industry yet, but it brings long-term value to the team as data is becoming the backbone of the organization. This is also a niche that differentiates your team from the rest.

    Link: https://towardsdatascience.com/its-time-to-set-sla-slo-sli-for-your-data-team-only-3-steps-ed3c93009aa5

    Dyskografia Kendricka Lamara w Pythonie

    Szukasz projektu, żeby wreszcie pobawić się Pythonem, proszę bardzo.

    Autor tego artykułu z użyciem Pythona stworzył wizualizacje słów, ich oddźwiek (pozytywny / negatywny / neutralny) itp.

    Abstrahując od artysty artykuł krok po kroku przeprowadza przez tematy analizy sentymentu, zbieranie i czyszczenie danych, punktowanie „bogatego” zaplecza językoweogo – do każdej z tych rzeczy jest przykładowy fragment kodu.

    A teraz do dzieła Sławomir, Zenek i inne Polskie tuzy tylko czekają na swoją kolej!

    Link: https://medium.com/geekculture/analyzing-and-scraping-the-lyrics-of-every-kendrick-lamar-album-in-python-b0551dcb563a

    Narzędzia

    explain.depesz.com - “PostgreSQL’s explain analyze made readable”

    Pracujesz z bazą PostgreSQL? Sprawdzasz plany wykonania zapytania? To narzędzie pomoże Ci nie jeden raz.

    Świetna strona internetowa, do której łatwo wkleisz plan wykonania zapytania i otrzymasz czytelny wynik na które części planu warto zwrócić uwagę. Dodatkowo możesz zachować publiczną formę planu lub zanonimizować wynik.

    Link: https://explain.depesz.com/

    Sprawdź Wiedzę

    #SQL

    Na podstawie wszystkich produktów (tabela PRODUCTS), stwórz listę nazw produktów (kolumna PRODUCT_NAME) i tablicę unikatowych kategorii (kolumna PRODUCT_CATEGORY) do których te produkty należą?

    ROZWIĄZANIE: https://www.db-fiddle.com/f/pDaBkugoEEMjTC9eEcx6J9/0

    Więcej pytań z SQL znajdziesz: SQL - Q&A

    Praca

    Szukane umiejętności: Analytics / Dashboarding Tools (Qlik / Tableau / PowerBI), Analytical skills, SQL