Data Craze Weekly #4
Tę wiadomość możesz otrzymać bezpośrednio na swoją skrzynkę dzięki zapisowi na newsletter – Data Craze Weekly.
Przegląd Tygodnia
Mit Self-Service BI
Niczym jednorożec sunący po tęczy wielokrotnie słyszałem jak self-service BI naprawi całą korporacyjną analitykę.
Self-service czyli oddanie analityki (możliwości tworzenia raportów / metryk etc.) w ręcę użytkowników jest świetną sprawą – co do tego nie ma wątpliwości.
Jak zawsze jednak problem tkwi w szczegółach.
Jeżeli nie zadbamy o jakość danych, monitorowanie narzędzia (ile raportów tworzą użytkownicy, jak często są używane, ile zajmują pamięci etc.), okresowe czyszczenie czy szkolenia z obsługi narzędzia, mogę z dużą dozą prawdopodobieństwa powiedzieć, że „Houston We have a problem.”
Niestety nie ma magicznych sposobów na analitykę, jest za to pełno żmudnej pracy, która jak wykonana dobrze da świetne rezultaty.
Cytując za autorką:
In this case, Self-Service BI is not the golden ticket to solve all company’s problems, rather it’s a tool to enable the top-notch analytics.
SLA, SLO, SLI dla zespołów odpowiedzialnych za dane
Być może znasz złoty standard w postaci 11-stu, 9-tek określających czy to dostępność czy trwałość usługi.
A czy da się takie metryki odwzorować w świecie danych? Czy Twój zespół ma swoje SLA, SLO czy SLI? Czym te metryki są?
Jeżeli klient zgłasza nam błąd w danych czy mamy jakiś proces, określający jak to naprawić? Czy jesteśmy w stanie dać informację jak długo zajmie naprawa?
Czym to wszystko jest i jak wdrożyć takie tematy krok po kroku opisuje Xioaxu Gu w swoim artykule.
Istotny jest fakt – nie ważne jak nazwiemy metryki czy procesy. Jeżeli nie sprawdzamy i nie mierzymy elementów procesu jako zespół to nigdy nie będziemy wiedzieć co idzie dobrze co źle i czy mamy coś do poprawy.
You can’t improve what you don’t measure. As a mature data team, you should start thinking about data reliability from today. It’s not a hot topic in the industry yet, but it brings long-term value to the team as data is becoming the backbone of the organization. This is also a niche that differentiates your team from the rest.
Dyskografia Kendricka Lamara w Pythonie
Szukasz projektu, żeby wreszcie pobawić się Pythonem, proszę bardzo.
Autor tego artykułu z użyciem Pythona stworzył wizualizacje słów, ich oddźwiek (pozytywny / negatywny / neutralny) itp.
Abstrahując od artysty artykuł krok po kroku przeprowadza przez tematy analizy sentymentu, zbieranie i czyszczenie danych, punktowanie „bogatego” zaplecza językoweogo – do każdej z tych rzeczy jest przykładowy fragment kodu.
A teraz do dzieła Sławomir, Zenek i inne Polskie tuzy tylko czekają na swoją kolej!
Narzędzia
explain.depesz.com - “PostgreSQL’s explain analyze made readable”
Pracujesz z bazą PostgreSQL? Sprawdzasz plany wykonania zapytania? To narzędzie pomoże Ci nie jeden raz.
Świetna strona internetowa, do której łatwo wkleisz plan wykonania zapytania i otrzymasz czytelny wynik na które części planu warto zwrócić uwagę. Dodatkowo możesz zachować publiczną formę planu lub zanonimizować wynik.
Link: https://explain.depesz.com/
Sprawdź Wiedzę
#SQL
Na podstawie wszystkich produktów (tabela PRODUCTS), stwórz listę nazw produktów (kolumna PRODUCT_NAME) i tablicę unikatowych kategorii (kolumna PRODUCT_CATEGORY) do których te produkty należą?
ROZWIĄZANIE: https://www.db-fiddle.com/f/pDaBkugoEEMjTC9eEcx6J9/0
Więcej pytań z SQL znajdziesz: SQL - Q&A
Praca
- Product Data Analyst, YuLife – UK (London) – £30,000 – £45,000
Szukane umiejętności: Analytics / Dashboarding Tools (Qlik / Tableau / PowerBI), Analytical skills, SQL