mastouille.fr est l'un des nombreux serveurs Mastodon indépendants que vous pouvez utiliser pour participer au fédiverse.
Mastouille est une instance Mastodon durable, ouverte, et hébergée en France.

Administré par :

Statistiques du serveur :

585
comptes actifs

#ETL

0 message0 participant0 message aujourd’hui

🔔 Slides zu Legal Data Engineering 🔔

Was ist Legal Data Engineering? Wie sieht die Praxis juristischer Daten in Deutschland aus? Welche rechtlichen Probleme ergeben sich im Zusammenhang mit Legal Data Engineering? Diese Präsentation bietet eine Einführung zu Legal Data Engineering und sucht Antworten auf diese Fragen.

Slides: zenodo.org/records/15575231/fi

Legal Data Engineering ist der Schwerpunkt eines jeden Legal Data Science Projekts. Kern von Data Engineering ist der ETL-Prozess: Extraktion, Transformation und das (Hoch-)Laden von Daten. Die Slides bieten dazu einen allgemeinverständlichen Überblick.

Weitere praktische Themen sind die Verfügbarkeit juristischer Daten in Deutschland (insbesondere strukturierter Daten und Programmierschnittstellen), Probleme bei der Tokenisierung in Large Language Models und die Fehlerkennung von Gen-Namen in Microsoft Excel.

Bei den rechtlichen Fragen des Legal Data Engineering behandle ich die tradierte Rechtslage, das neue Datennutzungsgesetz (DNG) und Bayern als Negativbeispiel einer verschlossenen juristischen Datenkultur. Eine Diskussion der Datenschutzklage gegen OpenJur und der Open Data-Klage der Gesellschaft für Freiheitsrechte (GFF) gegen die Bundespolizei klären über aktuelle Entwicklungen in diesem Rechtsbereich auf.

Talend, probably the only mature open source Extract Transform Load (ETL) tool to work with data, is no longer maintained and is retired :ablobcatcry:

Apparently one year ago Qlik, which owns Talend, said open-source version of Talend Studio "does not contribute to Qlik's commercial products".

It's so sad because DBT, which some dare to call ETL tool (in fact it is more of a templating engine) is far from functionality an ETL tool is supposed to offer :blobcatthink:

#data#engineering#etl

The traditional ETL-Process consist of Extract-Transform-Load. But in tools like Data Cloud from Salesforce there is now the Zero-ETL technology integrated: Instead of requiring these 3 traditional steps, data should now flow seamlessly between different systems.

So, what's new? The data from different systems can be used almost in real-time. There is no need to move data :blobcoffee: towardsdatascience.com/why-etl

#DataEngineering #data #datascience #database #salesforce #DataIntegrationDatabasesEtl #etl #python

Comment for the friend link of the Medium article and I will send you the link in a message.

Towards Data Science · Why ETL-Zero? Understanding the shift in Data Integration | Towards Data ScienceWhen I was preparing for the Salesforce Data Cloud certification, I came across the term Zero-ETL. The Data Cloud offers the possibility...

À l'occasion de la mise en production dans #IDS de @leslibresgeographes d'un service #ETL de données #openstreetmap avec les #tags en anglais mais aussi en français pour les 28 pays #francophone du Sud (grâce aux extracts et diffs de @osm_fr), je publie un billet de blog pour retracer le contexte, l'historique, l'approche technique et les moyens d'accéder à cette donnée #OSM #opendata #commun #georchestra #qgis leslibresgeographes.org/des-do

Ich mag nochmal auf unsere Werki-Stelle in #Erlangen oder #Marburg hinweisen: 👉 jobs.siemens-healthineers.com/

Zu tun haben wir genug und je nach persönlichen Zielen bist Du eher im Front-End (#Qlik, Analysen für internationale Nutzer, #PowerBI,...) oder hilfst mir hinter den Kulissen (#Python, #SQL, #ETL, Berechtigungsmanagement...).

Deinen neuen Laptop habe ich gerade bestellt, jetzt fehlst nur noch Du. #Job #Werkstudent #SiemensHealthineers #Healthineers

jobs.siemens-healthineers.comWerkstudent*in (w/m/d) Market Analytics | Erlangen, Bayern, Germany | SiemensDiscover exciting job opportunities at Siemens. Explore a diverse range of positions on our job portal, from entry-level to executive roles. Join our team

Check this out!

#DAGMonitor is an iOS app for data engineers that helps monitor and control DAGs on your server. With help of the app, data engineers can access server jobs, monitor task instances, rerun them and read through task logs. Simply specify the username and password in the app settings and connect to your company's network (if your server is available only from the corporate WiFi or VPN).

FEATURES AVAILABLE IN VERSION 1.0:
• Connect to server via API (simple user/password authentication supported)
• List DAGs and get info about paused ones
• Access DAG runs and monitor statuses
• List task instances for DAG run
• Clear status for a task instance
• Access task instance logs

apps.apple.com/me/app/dag-moni

App Store‎DAG Monitor‎DAG Monitor is an app for data engineers that helps monitor and control DAGs on your server. With help of the app, data engineers can access server jobs, monitor task instances, rerun them and read through task logs. FEATURES: • Connect to server via API • List DAGs and get info about paused ones •…
#data#iOS#dag

#Emploi de Data Manager pour l'Open Data.

Expérience dev #Python #R #ETL #SQL #SAP

Connaissance des principes de l'#OpenData, de l’#Interopérabilité et de la gouvernance des données.
#Fribourg #Suisse

Délai : 31.01.2024

#jerecrute ... enfin, pas moi, c'est pour le motdiese... c'est à l'état de Fribourg.

jobs.fr.ch/job/Fribourg%2C-CH-

jobs.fr.chData Manager pour l'Open DataData Manager pour l'Open Data
Suite du fil

Can someone clarify whether it is feasible to create some type of #API that would allow existing FOSS apps to automatically export that apps data to a specific predefined format (just as an example, #openmhealth ) We already have FOSS that's that can collect manually recorded data and export them, would it be feasible to add additional export functions so that an external app can collect it from multiple apps using the same mechanism? #askfedi #ETL ❓❓❓

I feel like I can do more with Meltano+DBT as a modern #ETL stack than nearly every other platform in existence.

And it costs me $0 to license. Just have to pay to run it somewhere, either by buying a server or two or running it in the cloud.