mastouille.fr est l'un des nombreux serveurs Mastodon indépendants que vous pouvez utiliser pour participer au fédiverse.
Mastouille est une instance Mastodon durable, ouverte, et hébergée en France.

Administré par :

Statistiques du serveur :

589
comptes actifs

#estadistica

0 message0 participant0 message aujourd’hui

La importancia de la calidad de los datos

La importancia de la calidad de los datos
Este mes serán dedicados los artículos de nuestro espacio a conocer algunos aspectos relacionados sobre la importancia de contar con datos de calidad, esta semana iniciaremos con una introducción al respecto. Parte 1 de 4: La calidad de los datos En la Ciencia de Datos, una de las principales banderas es: sin datos [...]

#CalidadDeLosDatos #CienciaDeDatos #Estadística #NuevasTecnologías

elmundo.cr/ciencia-de-datos/la

El Mundo CR · La importancia de la calidad de los datosLa importancia de la calidad de los datos Ciencia de Datos - El Mundo CR

No, el INE y el CIS no son lo mismo y ya vale de aguantar al cuñao de turno acordándose de Tezanos cuando salen las cifras del paro (?).

El Instituto Nacional de Estadística (INE): dependiente de la Secretaría de Economía y Empresa del Ministerio de Economía, encargado de elaborar estadísticas nacionales (de acuerdo al Plan Estadístico Nacional) y también de las estadísticas reguladas por la oficina estadística europea, el Eurostat. Entre sus estadísticas están la del paro (y todo lo relacionado con el mercado laboral), el PIB, el IPC (es decir, la inflación), las de condiciones de vida (pobreza en todas sus formas)... en general, buena parte de las estadísticas oficiales más tochas.

El Centro de Investigaciones Sociológicas (CIS): adscrito al Ministerio de la Presidencia, encargado de realizar (como su nombre indica) investigaciones sobre la sociedad española, como la intención de voto, las opiniones sobre ciertos aspectos, hábitos de salud, etc. así como de aglutinar investigaciones sociales realizadas en España, que han de depositarse en su banco de estudios. NO se encarga de realizar estadísticas oficiales.

Ambos organismos, a pesar de los recortes y de los contratiempos que han ido surgiendo (sobre todo en el segundo 🙃 ), hacen una aportación valiosísima de cara a conocer mejor el país en el que vivimos, pero no son lo mismo ni tampoco guardan relación. Ya veis que ni dependen del mismo ministerio.

El aporte de la estadística a la Ciencia de Datos

El aporte de la estadística a la Ciencia de Datos
Parte 2 de 4: El aporte de la estadística Continuando con la entrega de los aportes técnicos de las especialidades (Aportes técnicos de especialidades a la Ciencia de Datos), durante esta entrega se desarrolla el segundo de ellos relacionado con el aporte de la estadística. Aporte técnico de [...]

#CienciaDeDatos #CienciasSociales #Economía #Estadística #MachineLearning

elmundo.cr/ciencia-de-datos/el

El Mundo CR · El aporte de la estadística a la Ciencia de DatosEl aporte de la estadística a la Ciencia de Datos Ciencia de Datos - El Mundo CR

Holiiii vengo a contaros que el pasado 7 de marzo participé en un directo de Twitch para el #JustSciencing del canal de SherezadeMR, y ya está subido en YouTube por si le queréis echar un ojo. Dos horitas y media charlando sobre estadística y más, incluyendo COVID, nomofobia... y la deriva bailonga de Muse (!!)

Fue genial participar en una iniciativa tan guay. Ya me contaréis qué os parece!! 🥳

youtube.com/watch?v=XfgD9HXEJo

Esto que acabo de leer en LinkedIn me sirve para dar la brasa con un error muy frecuente (en el que ha caído esta personita de la captura):

Aleatorio/probabilístico ≠ UNIFORMEMENTE aleatorio

Que algo sea aleatorio NO significa que cada posible resultado salga con igual probabilidad, sino que el resultado que va a salir es *incierto* (es decir, no sabes de antemano qué va a salir).

Una moneda trucada con 99% de probabilidad de salir cara también es un experimento aleatorio. También está saliendo algo "al azar".

Y en el caso de las IAs generativas, basadas en textos de entrenamiento donde muy probablemente se están dando más unas cifras que otras (p. ej. hay muchos posts en internet refiriéndose a que si le preguntas a alguien un número al azar del 1 al 10 suele responderte 7), está claro que si le pides un número al azar no te lo va a distribuir de manera uniforme.

Articulación del proceso de cadena de valor del dato

Tradicionalmente en las empresas u organizaciones los perfiles del científico de datos que hemos visto el mes anterior trabajan por separados (unos equipos hacen la creación de datos, otros la transformación, otros los análisis y modelos y otros equipos las visualizaciones y comunicaciones) y ent [...]

#AnálisisDeDatos #CadenaDeValorDelDato #CienciaDeDatos #CientíficoDeDatos #Estadística #PerfilesDelCientíficoDeDatos

elmundo.cr/ciencia-de-datos/ar

El Mundo CR · Articulación del proceso de cadena de valor del datoArticulación del proceso de cadena de valor del dato Ciencia de Datos - El Mundo CR

El científico de datos con perfil comunicador

Parte 5 y Final: Perfil Comunicador Continuando con la entrega de los perfiles del científico de datos (El científico de datos con perfil analítico avanzado), durante esta entrega se desarrolla el cuarto de ellos relacionado con el analítico avanzado. Perfil E: Comunicador El científico de datos co [...]

#AnálisisDeDatos #CienciaDeDatos #CientíficoDeDatos #Estadística #Matemáticas #PerfilAnalíticoAvanzado #PerfilComunicador

elmundo.cr/ciencia-de-datos/el

El Mundo CR · El científico de datos con perfil comunicadorEl científico de datos con perfil comunicador Ciencia de Datos - El Mundo CR

El científico de datos con perfil analítico avanzado

Parte 4 de 5: Perfil analítico avanzado Continuando con la entrega de los perfiles del científico de datos (El científico de datos con perfil analítico intermedio), durante esta entrega se desarrolla el cuarto de ellos relacionado con el analítico avanzado. Perfil D: Analítico avanzado El científico de datos c [...]

#AnálisisDeDatos #CienciaDeDatos #CientíficoDeDatos #Estadística #Matemáticas #PerfilAnalíticoAvanzado

elmundo.cr/ciencia-de-datos/el

El Mundo CR · El científico de datos con perfil analítico avanzadoEl científico de datos con perfil analítico avanzado Ciencia de Datos - El Mundo CR

Por cierto, ayer respondí una pregunta en el Neospring sobre el coeficiente de Gini y su versatilidad. Os la dejo por aquí:

¿Es útil calcular el Coeficiente de Gini para analizar la desigualdad en cualquier ámbito, aunque no tenga nada que ver con la economía ni los ingresos económicos? ¿Sabrías decir algún otro ámbito específico donde tenga sentido calcularlo? — (que se construye con la suma acumulativa de los valores de tu variable X dividida entre la suma de todos los X) y la recta Y = X que representaría una igualdad perfecta en la distribución (es decir, el valor de X es el mismo para todos los individuos)... neospring.org/+r/1390900223590

Neospring@picanumeros answered: ¿Es útil calcular el Coeficiente de Gini para analizar la desigualdad en cualquier ámbito, aunque no tenga nada que ver con la economía ni los ingresos económicos? ¿Sabrías decir algún otro ámbito específico donde tenga sentido calcularlo?Sí, claro. El Coeficiente de Gini se calcula como el área que queda entre la curva de Lorenz que forman tus datos (que se construye con la suma acumulativa de los valores de tu variable X dividida entre la suma de todos los X) y la recta Y = X que representaría una igualdad perfecta en la distribución (es decir, el valor de X es el mismo para todos los individuos). Fíjate que la definición no especifica que lo que representa la X sea economía, ingresos, bienes... puede ser cualquier variable. Lo que pasa es que en ese tipo de variables el coeficiente de Gini es bastante más interesante, porque lo que está midiendo es en qué grado hay individuos con valores de X mucho mayores que otros, y si hablamos de cantidades entonces nos está contando si hay individuos que están acumulando más bienes, dinero o contaminación que otros. Por citarte un ejemplo, yo calculé el coeficiente de Gini para las cifras de matriculaciones en distintos grados para hombres y para mujeres. Con esto quería visualizar si entre los hombres o entre las mujeres había grados que se quedaban con el grueso de matriculaciones mientras que el resto recibían muy poco estudiantado. Lo tienes en este post de mi blog (está al final de la entrada): https://picanumeros.wordpress.com/2019/12/09/brecha-de-genero-en-los-estudios-evolucion-del-de-mujeres-matriculadas-en-carreras-universitarias-publicas-desde-1985-a-2014/

Estás con tu gente organizando un amigo invisible.

Juntáis todos los papelitos, los removéis, empezáis a sacar un papelito por persona... y de repente a alguien le da la risa tonta.

Ha sacado un papel con su propio nombre. Se va a autorregalar algo.

¿Qué probabilidad había de que pasara esto? 🧵

(utilizaré el hashtag #PicaRegalos por si queréis seguirlo o silenciarlo de vuestra TL)

La estadística tiene una serie de métodos muy útiles que nos permite agrupar un conjunto de elementos cualquiera en diversos grupos según sus características.

Y lo permite hacer incluso aunque la luz de la verdad esté apagada.

Hoy hablamos de análisis cluster.

¿Qué es? ¿Cómo se hace?

(utilizaré el HT #PicaCluster por si quieres silenciar este hilo o seguirlo/guardarlo)

¿Cuáles son los principales problemas que cree Españita que tendrá el mundo en el futuro?

Me he dado una vuelta por los datos del CIS del pasado miércoles, y entre los diez problemas más citados aquellos relacionados con el clima tienen mayor cuota de protagonismo.

Ojo: en el gráfico sale el Top-10 de problemas más mencionados (los que cabían), pero el listado que da el CIS se va hasta 50 problemas diferentes mencionados. Podéis consultar todo el listado aquí: cis.es/documents/d/cis/es3486m (página 14).

El científico de datos

Como lo hemos indicado en nuestro artículo anterior (Una breve introducción a la ciencia de datos), La ciencia de datos permite desarrollar la habilidad de resolver problemas por medio del uso de los datos, y esto es lo que realmente permite generar valor, pero ¿Quién tiene esa habilidad? La profesión hoy se llama científico de […]

#CienciaDeDatos #CientíficoDeDatos #Economía #Empleo #Estadística #Finanzas #Matemáticas #Programación

elmundo.cr/ciencia-de-datos/el

El Mundo CR · El científico de datosEl científico de datos Ciencia de Datos - El Mundo CR

Esta nueva encuesta de 40db (n = 2.000 de un panel online mediante cuotas demográficas) arroja resultados interesantes: RRSS y mercadillos como escaparate, clubs de lectura... y contiene un ejemplo de lo que suelen ser las preguntas de respuesta abierta: un desmadre.

Una de las preguntas (que sólo se hacía a la gente que declarase leer más que "casi nunca") consistía en decir quién es el escritor español más relevante del siglo XXI.

Se nombraron 228 escritor@s diferentes. Algunos no españoles. Algunos de antes del S·XXI (50 personas han respondido Cervantes). Y, sobre todo, muchas respuestas unifrecuenciales, entre las cuales tenemos a gente que ha mencionado a Jordi Wild o La Vecina Rubia (por poner dos ejemplos).

elpais.com/babelia/2024-11-23/

El País · La gran encuesta al lector español del siglo XXI: ¿Qué leemos? ¿Quién lee? ¿Qué distingue a los Z? Miles de personas responden al cuestionario realizado para EL PAÍS y la Ser por 40dB. Hay buenas y malas noticias, pero también sorpresas. Estas son las 10 claves