Modelado automático a través del análisis demográfico de la interacción del usuario

  1. Pariente Martínez, Beatriz
Dirigida por:
  1. Bernardo Martín González Rodríguez Director/a
  2. Daniel Fernández Lanvín Codirector/a

Universidad de defensa: Universidad de Oviedo

Fecha de defensa: 09 de julio de 2020

Tribunal:
  1. Juan Manuel Cueva Lovelle Presidente/a
  2. Javier de Andrés Suárez Secretario/a
  3. Beatriz Pérez Valle Vocal
  4. José Ramón Hilera González Vocal
  5. Káthia Marçal de Oliveira Vocal

Tipo: Tesis

Teseo: 629076 DIALNET lock_openRUO editor

Resumen

La personalización del comercio electrónico hace que aumenten las ventas mejorando la percepción del usuario en cuanto a la calidad del sitio web. Sin embargo, algún dato demográfico sobre los clientes, el cual es crucial para el éxito en el proceso de personalización, no siempre se puede obtener explícitamente como ocurre en el caso de las visitas anónimas a los sitios web. Esta tesis analiza si es posible construir un sistema automático que categorice los visitantes de una web dependiendo de su edad o género a través del análisis del tiempo de ejecución requerido al completar algunas tareas básicas de interacción. Con este propósito, se ha realizado un test de interacción con la participación de 592 personas. En este experimento, estos individuos tuvieron que ejecutar 5 tareas de interacción: Apuntar y hacer click, Arrastrar y soltar, Selección de texto, Escritura de texto y Selección de elementos en un menú. Mientras realizaban este experimento el tiempo en milisegundos gastado en cada prueba fue recogido y guardado para su posterior análisis. Antes de que completasen las pruebas, cada individuo rellenó un cuestionario con sus características demográficas: edad, género, lateralidad, horas de uso del ordenador, etc. El sistema de clasificación automática de usuarios en base a su edad o género puede llevarse a cabo analizando el rendimiento de los usuarios en la ejecución de estas tareas y comparándolo con el rendimiento alcanzado por los usuarios cuyas características son conocidas. Este trabajo requería un estudio estadístico previo que nos permitiese verificar si estas características demográficas son significativamente determinantes en el rendimiento de los usuarios mientras realizan estas tareas de interacción. Este estudio mostró que la edad y el género sí que afectan el rendimiento en ciertas tareas y cómo el rendimiento obtenido de los usuarios en cada prueba era consistente con su tiempo de ejecución en las otras tareas. Con respecto a la edad, los resultados mostraron que el envejecimiento tiene un impacto negativo en el rendimiento de estas tareas de interacción, los usuarios mayores se desempeñaron peor que los más jóvenes. El incremento en el tiempo de ejecución general para cada tarea resultó ser mucho mayor en personas mayores de 40 años. Este resultado nos hace creer que sería relativamente fácil clasificar a las personas mayores y menores de esta edad utilizando agentes que recopilaran datos. Respeto el género, en cada tarea de interacción, los hombres obtuvieron mejores resultados que las mujeres, en especial, los hombres obtuvieron mejores resultados al ejecutar operadores de interacción basados en señalar y arrastrar. Las diferencias fueron tan relevantes que pueden usarse para el diseño de algoritmos para la clasificación automática. De acuerdo con eso, se probaron algoritmos de Machine learning como Bagging (Bagging, Random forest), Boosting (AdaBoost.M1, LogitBoost), SVM (SMO), C4.5 (J48), Logistic y Stacking para construir un sistema de perfilado automático clasificando al individuo por edad (menores de 40 y mayores de 40 años) o por género (masculino, femenino). Los resultados obtenidos con los algoritmos de aprendizaje automático fueron muy positivos y concluyentes. En cuanto a la clasificación por edad, los resultados obtenidos nos dieron un AUC-PR del 97%, un F-score del 95% y un RMSE del 25-26%. En el caso del género, se obtuvo un AUC-PR del 85-87% con un RMSE del 41%. Al comparar ambos resultados, se puede apreciar que los resultados de la edad son más precisos que los de género. Esto concuerda con muchos estudios que analizan los efectos de la edad y demuestran que el envejecimiento afecta negativamente la capacidad de usar ordenadores reduciendo el rendimiento mientras los usan. Para concluir, estos resultados demostraron que los algoritmos de Machine learning se pueden usar para predecir la edad o el género de un usuario mientras navega por un sitio web y realizar tareas comunes de interacción humana con el ordenador como señalar y hacer clic, arrastrar y soltar, seleccionar texto, escribir texto o seleccionar elementos en un menú. Este perfilado automático se podría utilizar para proporcionar diferentes contenidos a diferentes tipos de usuarios y también para adaptar la apariencia y el comportamiento de diferentes elementos de la interfaz de usuario. Este enfoque no solo podría aumentar el rendimiento general del usuario, sino que también podría contribuir significativamente a mejorar la experiencia del usuario en el sitio.