mastouille.fr est l'un des nombreux serveurs Mastodon indépendants que vous pouvez utiliser pour participer au fédiverse.
Mastouille est une instance Mastodon durable, ouverte, et hébergée en France.

Administré par :

Statistiques du serveur :

586
comptes actifs

#DataEngineering

1 message1 participant0 message aujourd’hui

@hynek released another great video on uv, where he explained how he uses the just tool to store commands in a cross‑platform, portable way for everyday tasks like installing or refreshing virtual environments, running tests and code checks and even development tasks like sending requests.

youtube.com/watch?v=TiBIjouDGuI

🧙‍♂️ One does not simply build reports on OLTP data…

This week on The Drill Down with Ahmad & James, our special guest
Kristyna Ferris will be presenting a session titled "The Fellowship of the Star Schema: Transforming OLTP Data for Power BI"

🛠️ This session is packed with:
- Clear distinctions between OLTP & OLAP
- Tips for building Power BI-ready models
- A sprinkle of Slowly Changing Dimension magic

💡Whether you’re a data wizard 🧙, business hobbit 🧝‍♀️, or SQL ranger 🏹 — this is your quest.

🗓️ Join us LIVE on LinkedIn | Wednesday, July 2nd @ 2PM Central
lnkd.in/eWh4SsBb

While indexes are useful, relying on them too much can be like Maslow's hammer. @treyhunner has shown some fantastic alternative methods for common tasks without constantly needing to use indexes.

pythonmorsels.com/avoid-indexe

www.pythonmorsels.comAvoid indexes in PythonPython code that uses indexes can often be refactored into more readable code that doesn't rely on indexing.

Last month, two new Rust-based Python type checkers, pyrefly and ty were released. Both of them are in the alpha stage. While they share some similarities, they differ significantly in design and features. In this article, Edward Li dove deep into both tools, highlighted their differences and what makes each one unique.

blog.edward-li.com/tech/compar

Edward Li's Blog · Pyrefly vs. ty: Comparing Python’s Two New Rust-Based Type CheckersA deep dive into Meta's pyrefly and Astral's ty - two new Rust-based Python type checkers that both promise faster performance and better type inference.

🔔 Slides zu Legal Data Engineering 🔔

Was ist Legal Data Engineering? Wie sieht die Praxis juristischer Daten in Deutschland aus? Welche rechtlichen Probleme ergeben sich im Zusammenhang mit Legal Data Engineering? Diese Präsentation bietet eine Einführung zu Legal Data Engineering und sucht Antworten auf diese Fragen.

Slides: zenodo.org/records/15575231/fi

Legal Data Engineering ist der Schwerpunkt eines jeden Legal Data Science Projekts. Kern von Data Engineering ist der ETL-Prozess: Extraktion, Transformation und das (Hoch-)Laden von Daten. Die Slides bieten dazu einen allgemeinverständlichen Überblick.

Weitere praktische Themen sind die Verfügbarkeit juristischer Daten in Deutschland (insbesondere strukturierter Daten und Programmierschnittstellen), Probleme bei der Tokenisierung in Large Language Models und die Fehlerkennung von Gen-Namen in Microsoft Excel.

Bei den rechtlichen Fragen des Legal Data Engineering behandle ich die tradierte Rechtslage, das neue Datennutzungsgesetz (DNG) und Bayern als Negativbeispiel einer verschlossenen juristischen Datenkultur. Eine Diskussion der Datenschutzklage gegen OpenJur und der Open Data-Klage der Gesellschaft für Freiheitsrechte (GFF) gegen die Bundespolizei klären über aktuelle Entwicklungen in diesem Rechtsbereich auf.