Resumen: Predecir si los ingresos superan los $ 50K / año según los datos del censo. También conocido como conjunto de datos "Ingresos del censo"
Fuente:
1) Propietarios originales de la base de datos:
Oficina del Censo de EE.UU.
2) Donante de la base de datos:
Ronny Kohavi y Barry Becker.
Minería y visualización de datos.
Gráficos de silicio.
Correo electrónico: ronnyk@sgi.com
3) Fecha de recepción:
(Las bases de datos pueden cambiar con el tiempo sin cambiar el nombre)19/05/96
Información del conjunto de datos:
Barry Becker realizó la extracción de la base de datos del censo de 1994. Se extrajo un conjunto de registros razonablemente limpios utilizando las siguientes condiciones: ((EDAD> 16) && (AGI> 100) && (AFNLWGT> 1) && (HRSWK> 0)). La tarea de predicción es determinar si una persona gana más de 50 mil al año.
Información de atributos:
Listado de atributos:
> 50K, <= 50K.
Edad: continua.
Clase de trabajo: Privado, Self-emp-not-inc, Self-emp-inc, Federal-gov, Local-gov, State-gov, Sin paga, Nunca trabajado.
fnlwgt: continuo.
Educación: Licenciatura, Alguna universidad, 11 °, HS-grad, Prof-school, Assoc-acdm, Assoc-voc, 9 °, 7 ° a 8 °, 12 °, Maestría, 1 ° a 4 °, 10 °, Doctorado, 5 ° a 6 °, Preescolar.
número-educación: continuo.
Estado civil: Casado-civil-cónyuge, Divorciado, Nunca-casado, Separado, Viudo, Casado-cónyuge-ausente, Casado-AF-cónyuge.
Ocupación: Soporte técnico, Reparación artesanal, Otro-servicio, Ventas, Ejecutivo-gerencial, Prof-especialidad, Manipuladores-limpiadores, Máquina-op-inspct, Adm-clerical, Agricultura-pesca, Transporte-mudanza, Priv-house- serv, Protective-serv, Fuerzas-Armadas.
Parentesco: Esposa, Hijo Propio, Esposo, No en la familia, Otro pariente, Soltero.
Raza: Blanco, Asiático-Pac-Isleño, Amer-Indio-Esquimal, Otro, Negro.
Sexo: Femenino, Masculino.
Plusvalía: continua.
Pérdida de capital: continua.
Horas por semana: continuo.
País de origen: Estados Unidos, Camboya, Inglaterra, Puerto Rico, Canadá, Alemania, Periferia de EE. UU. (Guam-USVI-etc), India, Japón, Grecia, Sur, China, Cuba, Irán, Honduras, Filipinas, Italia , Polonia, Jamaica, Vietnam, México, Portugal, Irlanda, Francia, República Dominicana, Laos, Ecuador, Taiwán, Haití, Colombia, Hungría, Guatemala, Nicaragua, Escocia, Tailandia, Yugoslavia, El-Salvador, Trinadad y Tobago, Perú, Hong , Holanda-Países Bajos.
Papeles relevantes:
Ron Kohavi, "Ampliación de la precisión de los clasificadores Naive-Bayes: un árbol de decisiones híbrido", Actas de la Segunda Conferencia Internacional sobre Descubrimiento de Conocimientos y Minería de Datos, 1996.
Comments