Revista Polo del Conocimiento


Polo del Conocimiento

 

 

 

Sistema de recomendacin difuso de productos basado en lgica difusa

 

Fuzzy product recommendation system based on fuzzy logic

 

Sistema de recomendao de produtos fuzzy baseado em lgica fuzzy

 

 

Ricardo Geovany Garca-Morales I
rgarcia0961@utm.edu.ec
 http://orcid.org/0000-0003-2131-5717
Emanuel Guillermo Muoz-Muoz II
emanuel.munoz@utm.edu.ec
 http://orcid.org/0000-0002-0997-0578
 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


Correspondencia: [email protected]

 

 

 

Ciencias Tcnicas y Aplicadas

Artculo de Investigacin

 

* Recibido: 23 de julio de 2022 *Aceptado: 12 de agosto de 2022 * Publicado: 08 de septiembre de 2022

 

 

  1. Ingeniero Comercial, Universidad Tcnica De Manab, Ecuador.
  2. Magster Scientiae Estadstica Aplicada, Unalm, Universidad Nacional Agraria La Molina, Ingeniero en Sistemas Informticos, Universidad Tcnica De Manab, Ecuador.

 

 

 

 


 

Resumen

Las tecnologas de la informacin son ampliamente reconocidas como instrumentos estratgicos, por su capacidad para modificar la estructura y los modelos de negocios de las organizaciones, en la actualidad la gran cantidad de informacin que debe manejar un individuo en su da a da lo imposibilitan optimizar tiempo en la bsqueda de informacin deseada, los sistemas de recomendaciones son en la actualidad una herramienta que ayuda a la toma de decisiones y que poco a poco se ha ido involucrando en el mercado y dndole las oportunidades a las empresas a ser ms competitivas. El objetivo principal de esta investigacin es disear un sistema de recomendaciones difuso para poder recomendar productos de la empresa Promyvent a sus clientes de acuerdo al perfil de cada uno de ellos. La metodologa utilizada en esta investigacin inicio con el pre procesamiento de la base de datos de entrada, se le aplico tcnicas de preparacin y limpieza adems se aplic un anlisis exploratorio de Datos el cual permite realizar un anlisis descriptivos, transformacin y limpieza de datos, se le aplico el mtodo del codo de jambu y se estableci que el nmero de clsters adecuado eran tres, luego en la fase de modelado se aplic el algoritmo KNN para clasificar cada uno de los datos segn las compras de los clientes con menor distancia calculada, luego para aumentar el nivel de precisin en la clasificacin de datos se aplic el mtodo C Means, de esta manera se obtiene una particin difusa optima otorgando un grado de membresa a cada punto de datos. Por ultimo como resultado la recomendacin se genera a partir del perfil de cada cliente, la precisin del modelo parte en base a los registros histricos de compras de los clientes para poder identificar el grado de membresa que tiene cada cliente de acuerdo a su perfil y partiendo de estos datos el modelo gener el filtrado de un top de siete productos en las recomendaciones de principal inters. El modelo implementado beneficia a la empresa no solo a recomendar un top siete de productos de inters de acuerdo al perfil del cliente si no tambin identificar los productos que tienen mayor y menor rotacin de inventario.

Palabras clave: Productos; Sistemas de recomendacin; Lgica difusa; Filtrado colaborativo; Ventas; KNN; C Means.

 

 

Abstract

Information technologies are widely recognized as strategic instruments, due to their ability to modify the structure and business models of organizations, currently the large amount of information that an individual must handle in their day to day makes it impossible to optimize time In the search for desired information, recommendation systems are currently a tool that helps decision-making and that little by little has been involved in the market and giving companies opportunities to be more competitive. The main objective of this research is to design a diffuse recommendation system to be able to recommend products from the company Promyvent to its clients according to the profile of each one of them. The methodology used in this research began with the pre-processing of the input database, preparation and cleaning techniques were applied, and an exploratory data analysis was applied, which allows a descriptive analysis, transformation and cleaning of data. I applied the jambu elbow method and it was established that the appropriate number of clusters was three, then in the modeling phase the KNN algorithm was applied to classify each of the data according to the purchases of the customers with the least calculated distance, then To increase the level of precision in data classification, the C Means method was applied, in this way an optimal fuzzy partition is obtained, granting a degree of membership to each data point. Finally, as a result, the recommendation is generated from the profile of each client, the accuracy of the model is based on the historical records of customer purchases in order to identify the degree of membership that each client has according to their profile and starting From this data, the model generated the filtering of a top seven products in the recommendations of main interest. The implemented model benefits the company not only by recommending a top seven products of interest according to the customer's profile, but also by identifying the products that have the highest and lowest inventory turnover.

Keywords: Products; recommendation systems; Diffuse logic; Collaborative filtering; Sales; KNN; C Means.

 

Resumo

As tecnologias da informao so amplamente reconhecidas como instrumentos estratgicos, devido a sua capacidade de modificar a estrutura e os modelos de negcios das organizaes, atualmente a grande quantidade de informaes que um indivduo deve manipular no seu dia a dia impossibilita a otimizao do tempo na busca pelo informaes, os sistemas de recomendao so atualmente uma ferramenta que auxilia a tomada de deciso e que aos poucos vem se envolvendo no mercado e dando s empresas oportunidades de serem mais competitivas. O objetivo principal desta pesquisa projetar um sistema de recomendao difuso para poder recomendar produtos da empresa Promyvent aos seus clientes de acordo com o perfil de cada um deles. A metodologia utilizada nesta pesquisa comeou com o pr-processamento do banco de dados de entrada, foram aplicadas tcnicas de preparo e limpeza, e foi aplicada uma anlise exploratria dos dados, que permite uma anlise descritiva, transformao e limpeza dos dados. e foi estabelecido que o nmero adequado de clusters era trs, ento na fase de modelagem foi aplicado o algoritmo KNN para classificar cada um dos dados de acordo com as compras dos clientes com a menor distncia calculada, ento para aumentar o nvel de preciso em Na classificao dos dados, foi aplicado o mtodo C Means, desta forma obtida uma partio fuzzy tima, concedendo um grau de pertinncia a cada ponto de dados. Por fim, como resultado, a recomendao gerada a partir do perfil de cada cliente, a acurcia do modelo baseada nos registros histricos de compras dos clientes a fim de identificar o grau de adeso que cada cliente possui de acordo com seu perfil e a partir de Com esses dados, o modelo gerou a filtragem de um dos sete principais produtos nas recomendaes de interesse principal. O modelo implementado beneficia a empresa no s por recomendar os sete principais produtos de interesse de acordo com o perfil do cliente, mas tambm por identificar os produtos que apresentam maior e menor giro de estoque.

Palavras-chave: Produtos; sistemas de recomendao; Lgica difusa; Filtragem colaborativa; Vendas; KNN; C significa.

 

Introduccin

De Las profundas transformaciones experimentadas en el entorno empresarial desde finales de los sesenta han introducido dificultades adicionales en los procesos decisionales de las empresas, en los que las unidades econmicas aplicaban mtodos y modelos de gestin explorativos se han pasado a encontrar estructuras de encuadramiento institucionales, sociales, econmicas, tecnolgicas y socioculturales en constante transformacin (Esteban, 2017), el uso de las tecnologas a nivel mundial ha ido creciendo a travs de los aos gracias a la constante investigacin cientfica y tecnolgica, debido a que existen muchas maneras de usar las tecnologas en esta era de transformacin digital y muchos pases han ido adoptando formas en las cuales pueden realizar eficientemente trabajos, cometiendo menos errores (Kishnani Garca, 2020).

Ante este nuevo panorama las empresas necesitan conocer mtodos de obtencin de informacin y tcnicas para tratarla por lo cual es indispensable buscar ventajas competitivas y por ende un desarrollo econmico a largo plazo (Esteban, 2017), en la actualidad existen multitudinarios cambios en los mercados, organizaciones, tecnologas, sociedades y culturas, razn por la cual se considera poco pertinente seguir maniobrando bajo el mismo enfoque tradicional, para lograr ser competitivo dentro de este entorno tan cargado de dinamismo y turbulencia (Pita, 2018), de manera que es cada vez mayor la cantidad de organizaciones empresariales que confan en sistemas de informacin para llevar a cabo el manejo de sus operaciones, interactuar con proveedores y clientes y competir en el mercado en el que se desenvuelven (Proao, 2018).

Las tecnologas basadas en la Inteligencia Artificial (IA) ya estn siendo utilizadas para ayudar a los humanos a beneficiarse de mejoras significativas y disfrutar de una mayor eficiencia en casi todos los mbitos de la vida por lo que se puede aplicar en casi todas las situaciones (Rouhiainen, 2018), por esta razn los sistemas de recomendacin son actualmente soluciones exitosas para facilitar el acceso de los usuarios a la informacin que se ajusta a sus preferencias y necesidades en espacios de bsqueda sobrecargados, adems se han desarrollado varias metodologas para mejorar su desempeo (Yera, 2017), en consecuencia un Sistema de Recomendacin puede brindar informacin valiosa para asistir en el proceso de toma de decisiones del consumidor con el objetivo de proveer una recomendacin con exactitud y de manera precisa, ya que las recomendaciones que se producen ayudan a los seres humanos a satisfacer sus gustos personales y descubrir nuevos elementos, con menos esfuerzo, que si realizaran la actividad de manera manual (Prez, 2018), tambin permiten agrupar productos o servicios similares que sean de inters para el consumidor y aumentar su fidelizacin. La fidelizacin del cliente se logra mostrando que la empresa tiene en cuenta las distintas necesidades y preferencias del consumidor y ayudndolo a orientar su bsqueda hacia los productos que ms le interesan, en razn de que el sistema ha aprendido sus gustos y necesidades, lo que naturalmente aumenta la satisfaccin del cliente (Chesevar, 2018).

Este artculo tiene como objetivo desarrollar un modelo de sistema de recomendacin difusa de productos, los mismos que proyectan determinar los factores que permitan identificar el perfil de los clientes de la empresa y definir los escenarios para poder dar las recomendaciones productos que sean de inters del cliente para facilitar la labor de venta y la evaluacin del modelo a travs de los experimentos realizados con nuevos clientes para optimizar el proceso y la recomendacin sea ms eficiente. Los resultados en el proceso se garantizan mediante la utilizacin de algoritmos de agrupacin knn (vecino ms cercano) y c means los cuales establecen la precisin del modelo en base a los registros histricos de compras de los clientes para poder identificar el grado de membresa que tiene cada cliente de acuerdo a su perfil y poderlo clasificar a un determinado cluster, cada cliente se encasilla dependiendo del tipo de clase que sean los vecinos ms prximos a l y que generalmente su similitud es medida mediante una funcin de distancia euclidiana o manhattan.

De esta manera poder recomendar un top siete de productos de acuerdo a el perfil de cada cliente, recomendaciones que podrn ser utilizadas mediante el uso de aplicaciones mviles o pginas web, las cuales sern herramientas que ayudaran a mejorar el desempeo de los vendedores en el proceso de ventas, cabe destacar que las tcnicas y modelos aplicados en esta investigacin son dinmicos, es decir que el desempeo de la recomendacin vara dependiendo de los registros histricos de cada cliente, pues este puede ir evolucionando con el tiempo y las nuevas tendencias. Adems este modelo beneficia a la empresa no solo a recomendar un top siete de productos de inters de acuerdo al perfil del cliente si no tambin identificar los productos que tienen mayor y menor rotacin de inventario, tambin se lo puede aplicar en otras reas de la empresa como en departamentos crdito, marketing, Inventarios, entre otros para impulsar su desarrollo.

 

Base terica

 

Evolucin e innovacin tecnolgica empresarial

La evolucin digital, apresurada por la situacin actual de la pandemia del covid-19, nos ha inclinado a redisear nuestra forma de trabajar, influyendo en la forma que vivimos dando como efecto la apertura a nuevos modelos de negocios, y cambios en el mercado laboral (Chuya, 2021), En la actualidad existen multitudinarios cambios en los mercados, organizaciones, tecnologas, sociedades y culturas, razn por la cual se considera poco pertinente seguir maniobrando bajo el mismo enfoque tradicional, para lograr ser competitivo dentro de este entorno tan cargado de dinamismo y turbulencia (Pita, 2018), en el contexto de una empresa, los sistemas de informacin cumplen los objetivos de cualquier otro sistema en general, tales como: el procesamiento de entradas, el almacenamiento de datos relacionados con la entidad y la produccin de reportes y otro tipo de instrumentos de resumen de datos (Proao, 2018).

De modo que en un mercado globalizado es necesario que las empresas busquen soluciones basadas en las nuevas tecnologas, de forma que les permita proponer cambios transcendentales en su modelo de negocio, las tecnologas de informacin y comunicacin hoy por hoy se consideran parte significativa en la estrategia competitiva de la empresa, la operatividad de toda organizacin se respalda en el uso adecuado de tecnologas, a travs de las cuales es posible bajar costos, mejorando la calidad en la produccin con el uso eficiente de recursos en todas las reas de la empresa (Costa, 2018).

En los ltimos aos hemos visto una explosin de nuevas tecnologas que prometen cambiar la forma en que vivimos y definen a la innovacin como el motor de desarrollo socioeconmico y al emprendimiento como la herramienta para la consolidacin de estos procesos (Camino, 2017), as mismo la tecnologa, a travs de los aos, ha adquirido un papel importante en la manera como la humanidad realiza sus tareas cotidianas, en otras palabras, si se analiza, en los ltimos cien aos todas las sociedades desarrolladas y en va de desarrollo han tenido que hacer frente a una revolucin tecnolgica en los diferentes sectores primarios, secundarios y terciarios. El origen de esta revolucin es el aprovechamiento y el deseo de conseguir totalmente ventajas sobre los competidores de cada sector (PRIETO, 2018).

En este contexto estos sistemas son muy atractivos en situaciones donde la cantidad de informacin que se ofrece al usuario supera ampliamente cualquier capacidad individual de exploracin (Morales, 2018), la organizacin o institucin, est creada y formada por una persona o conjunto de personas, que se dedica a una actividad econmica concreta para conseguir unos objetivos que luego se conviertan en beneficios (Mero-Vlez, 2018)

De este modo las organizaciones en orden con el desarrollo cientfico y tecnolgico, han modificado sus estructuras en funcin a los cambios requeridos, entre ellos han centrado la atencin al diseo de controles internos, que promuevan la eficiencia en la operaciones, la salvaguarda de activos y la reduccin de los riesgos, garantizando fiabilidad de los estados financieros en observancia al cumplimiento de las leyes y normas vigentes (Jara, 2017)

Es por ello que la problemtica que presenta la empresa Promyvent, el crecimiento tecnolgico y las exigencias actuales en el sector comercial, establece la importancia de desarrollar un sistema de recomendaciones que le permitan alcanzar un desempeo optimo y as evolucionar para lograr satisfacer las necesidades de sus clientes y garantizar su competitividad y permanencia en un mercado; en constante cambio. Es por ello que la innovacin es entendida como la concepcin y establecimiento de cambios significativos en el producto, el proceso, el marketing o la organizacin de la empresa, con el propsito de mejorar sus resultados (Altamirano, 2020), es el pequeo o gran cambio que determinar el beneficio, el inters y la acumulacin de riqueza va en conjunto con el talento humano, la experiencia y aprendizaje, con lo que coexistir siempre y cuando, en su conjunto, la demanda del bien a producir sea alta y en base a estudios de comportamiento del consumidor (Gonzlez, 2018)

 

Sistema de recomendaciones

Debido al crecimiento exponencial de los datos en la era de la informacin moderna, existe una gran sobre carga de informacin y se estima que para el 2025, se creen 463 exabytes de datos a nivel mundial todos los das. Aunque las empresas cobran estos datos generados, ms de la mitad de estos datos no se utilizan debido a la falta de herramientas tiles y de las habilidades (Choenyi, 2021), por lo cual los Sistemas de Recomendacin son ampliamente utilizados en la recomendacin de productos en diferentes plataformas, los algoritmos que trabajan las recomendaciones son sofisticados y pueden requerir esfuerzos computacionales muy altos cuando trabajan en entornos de muchos usuarios y datos (Holguera, 2021)

Es una subclase de un sistema de filtrado, el cual pretende predecir el grado de aceptacin de un usuario hacia determinado objeto de esa manera poder realizarle recomendaciones a dicho usuario sobre objetos que a este le puedan interesar (Cuenca Mogro, 2019), de esta manera la funcin principal de los sistemas recomendados depende de los objetivos que hayan sido planteados al momento de su definicin e implementacin; pero en trminos generales suelen utilizar tres tipos de objetos 1 Recopilacin de informacin 2 Extraccin del conocimiento 3 La Recomendacin (Gmez, 2019), por esta razn la tecnologa de recomendacin es una parte importante debido a que puede brindar un mejor servicio a los usuarios y ayudarlos a obtener informacin en cualquier momento y en cualquier lugar, el sistema de recomendaciones debe proporcionar a los usuarios informacin rpida y precisa (Cui, 2020) .

Por tanto la importancia de los sistemas recomendaciones ha incrementado con el pasar de los aos. Los beneficios obtenidos con la implementacin de los mismos han sido exitosos debido a sus implementaciones en el campo de la ciencia, la educacin, la ingeniera, la medicina, etc. Como se puede evidenciar en esta ltima dcada la tecnologa ha cambiado de forma positiva diferentes mbitos acadmicos, sociales y culturales de las personas (Charnelli, 2017), es por ello que la innovacin es considerada como la variable clave para el xito de las empresas, ya que estas se desenvuelven en un ambiente dinmico que aumenta constantemente sus exigencias y demanda tanto en mercados nacionales como internacionales (Polo Otero, 2017)

El sistema de recomendaciones se puede realizar mediante diversas tcnicas como filtrado basado en contenido, el cual se utilizan filtros basados en colaboracin, esta tcnica tiene en cuenta la perfil que se construye en base a su anteriores calificaciones las mismas calificaciones que determinan su inclinacin e intereses, formando la base para recomendar un nuevo artculo, una calificacin ms alta denota una mayor probabilidad del usuario para visitar artculos similares por lo tanto, se recomienda un nuevo artculo de acuerdo con el nmero mximo de calificaciones dadas por el usuario en un gnero (Keerthana, 2021), por tanto el filtrado colaborativo es un mtodo para hacer predicciones sobre los intereses de un usuario basndose en informacin sobre las preferencias de otros usuarios. La suposicin subyacente es que si la persona A tiene la misma opinin que la persona B sobre algunos temas, entonces es ms probable que A al tener opiniones similares a las de B sobre diferentes temas (Kaushik, 2018).

Los sistemas de filtrado de informacin estn dirigidos a personas que carecen de la experiencia, la capacidad o el tiempo necesarios para evaluar la inmensa cantidad de tpicos que generalmente estn a su disposicin en un sitio Web y se basan en la premisa de que, habitualmente, la gente tiene en cuenta las recomendaciones provistas por otros para tomar decisiones rutinarias (Pacheco Pazmio, 2018)

 

Fuzzy C-Means

El ruido y los valores atpicos contribuyen al procedimiento computacional de los algoritmos, as como a los puntos de datos reales que conducen a centros de clster inexactos y fuera de lugar, El algoritmo Fuzzy C-Means (FCM) que adolece de estos problemas es el algoritmo de agrupamiento difuso ms popular y ha sido objeto de numerosas investigaciones y desarrollos (Askari, 2021), el cual permite extender la clasificacin ntida en una nocin de clasificacin difusa usando la medida de la suma de todos los errores cuadrticos ponderados y la distancia entre el centro se maximiza.

Podemos asignar membresa a los diversos puntos de datos en cada conjunto difuso, el resultado del algoritmo depende de la particin inicial lo cual nos puede llevar a un mnimo de la funcin objetivo, los resultado otorgan valores de pertenencia son nmeros menor o igual a 1. Por lo contrario, como los valores de agrupamiento se vuelven duros, es decir 0 o 1, es decir, controla el grado de participacin compartida entre grupos difusos (Flores Macalup, 2022)

 

KNN

El KNN o vecino ms cercano es uno de los clasificadores basados en vecindad ms populares en el aprendizaje automtico, dado su simplicidad y eficiencia para detectar y clasificar elementos en categoras, el parmetro k en KNN hace referencia al nmero de vecinos con el cual se define la pertenencia a una categora, este parmetro usualmente se determina empricamente, dependiendo del problema se prueba con diferentes valores de K, eligiendo el parmetro con el mejor desempeo en precisin (De-La-Hoz, 2019).

Es por ello que este algoritmo es catalogado como clasificador basado en instancias. Para clasificar, compara las instancias no vistas con aquellas etiquetadas del conjunto de entrenamiento utilizando una funcin de similitud y generalmente la similitud es medida mediante una funcin de distancia Euclidiana o Manhattan (Maillo, 2018)

 

Anlisis de componentes principales

El anlisis de componentes principales (ACP) es una tcnica de anlisis multivariante que permite la reduccin de la dimensionalidad de la base de datos y mejor interpretacin de la misma, con una mnima prdida de informacin. Desde el punto de vista matemtico los componentes principales son combinaciones lineales de las variables originales de manera que sean ortogonales entre s. La bsqueda de los componentes principales se reduce a la solucin de un problema de auto vectores y auto valores (de la Maza, 2019).

El mtodo anlisis por componentes principales consiste en la representacin de las medidas numricas de varias variables en un sitio de espacio reducido donde se puedan percibir las relaciones que de otra forma, permaneceran no visibles en dimensiones superiores tiene como objetivo transformar un conjunto de variables originales, en un nuevo conjunto de variables las cuales se caracterizan por estar correlacionadas entre s (Gallego, 2019)

 

El codo de Jambu

El mtodo del codo es un mtodo que se utiliza para producir informacin para determinar el mejor nmero de grupos al observar el porcentaje de la comparacin entre el nmero de grupos que formarn un codo en un punto. Este mtodo proporciona ideas/ideas seleccionando valores de conglomerados y luego agregando el valor del conglomerado que se usar como modelo de datos para determinar el mejor conglomerado (Nainggolan, 2019).

En este contexto es un mtodo visual para probar la consistencia del mejor nmero de clsteres, por ende la idea es determinar el nmero de conglomerados, luego sumar los conglomerados, calcular el error cuadrtico de la suma por conglomerado hasta el nmero mximo de conglomerados que se haya determinado, luego comparando la diferencia del error cuadrtico de la suma de cada conglomerado, la diferencia ms extrema forma el ngulo del codo muestra el mejor nmero de grupos (Umargono, 2020)

 

Nube de Palabras

Una nube de palabras es una representacin grfica vvida de las palabras delimitadas en una seccin de texto generada por herramientas orientadas a la web y es un mtodo de visualizacin de texto sencillo y visualmente atractivo. Tiene una utilidad verstil para proporcionar una visin general fraccionando el texto a aquellas palabras con mayor frecuencia (Padmanandam, 2021), son una tecnologa emergente para el anlisis de datos, se recomienda utilizar nubes de palabras como tableros porque brindan un anlisis fcil, rpido y significativo de datos cualitativos adems las nubes de palabras resumen o analizan datos de texto y brindan interpretaciones significativas a travs del tamao y el color del texto. (Sellars, 2018)

 

 

 

Metodologa

La perspectiva de la recomendacin parte por la necesidad de la innovacin y automatizacin empresarial con el fin de satisfacer las demandas de los clientes. Se refiere al cliente y a la empresa, donde el cliente tiene la necesidad de adquirir productos que sean de su inters y la empresa trata de cubrir esas necesidades. De esta manera, el conjunto de datos ser recopilado en la base de datos de la empresa, informacin proporcionada por los agentes vendedores que visitan al cliente de manera directa en distintos cantones de la provincia de Manab, teniendo en cuenta que cada cantn presenta caractersticas distintas por poblacin, economa y ubicacin geogrfica siendo en la ciudad de Portoviejo donde presenta un mayor nmero de clientes como se detalla en la (Fig. 1), el cual se describir el comportamiento y caractersticas del perfil de los clientes ya que debido a la cantidad de productos que distribuye la empresa esta posee clientes con distintos tipos de negocios lo que hace que cada uno tenga necesidades distintas teniendo en cuenta que la mayor cantidad de clientes que posee son Comerciales como se puede observar en la (Fig. 2).

Figura 1: Base de datos Promyvent Clientes por Cantn


Figura 2: Distribucin de Tipo de Negocio

 

Diseo del modelo

 

Figura 3: Diseo del Modelo

 

El diseo en la Figura 3 describe el sistema de recomendacin de productos que realiza el anlisis descriptivo, predictivo y prescriptivo. Consta de varias fases que son esenciales para el desarrollo del modelo; la primera fase es la recopilacin de las necesidades del cliente de acuerdo a su tipo de negocio Figura 2, la segunda fase se realiza el pre procesamiento de la informacin, donde se aplica tcnicas de transformacin y limpieza de datos mediante el uso de Phyton. La tercera fase de modelado, es la agrupacin de vecinos aplicando tcnicas de aprendizaje automtico como Media C Difusa, KNN (Vecinos ms cercanos), anlisis de componentes principales, funcin Test. La cuarta fase comprende a las recomendaciones de productos mediante las configuraciones de las especificaciones difusas en el perfil del cliente que podrn ser utilizadas por aplicaciones mviles o pginas web. En este caso utilizamos la informacin de la Base de Datos de Promyvent Figura 1.

 

Pre procesamiento

En esta fase comienza un pre procesamiento de datos de entrada. Se le aplica tcnicas de preparacin y limpieza de datos mediante el uso de Phyton, adems se aplica un anlisis Exploratorio de Datos el cual permite realizar un anlisis descriptivos, transformacin y limpieza de datos, (en este proceso se eliminaron los registros que no tienen datos los cuales seran las transacciones anuladas las cuales presentaban valores en cero y no seran de utilidad en esta investigacin) y de esta forma obtener datos ms precisos y confiables, Luego de la limpieza, estos datos estn preparados para ser modelar el sistema de recomendacin difuso, adems mediante la utilizacin del mtodo del codo de jambu, el cual utiliza los valores de la inercia obtenidos tras aplicar el K-means a diferente nmero de Clusters, siendo la inercia la suma de las distancias al cuadrado de cada objeto del Cluster a su centroide como se puede observar en la Figura 4 a todos los datos determina que nmero adecuado de clsteres a generar serian tres en el cual encasilla a cada uno de los clientes de acuerdo a su perfil. En la tabla 1 podemos apreciar las variables y los datos que servirn de entradas para todos los procesos de recomendacin de productos los cuales sern filtrados para obtener el final la recomendacin.

 

Figura 4: Nmero Adecuado de Clsteres

 

Figura 5: Grupo de Variables de entrada

 

La Ecuacin 1 se emplea para determinar los grupos creados de acuerdo al registro de las caractersticas del grupo de variables, este proceso se lleva a cabo asignando centroides aleatorios, los cuales se actualizan a los centros de cada grupo, con sus distancias hasta que la asignacin de registros queda fija.

La ecuacin 2 es la funcin de pertenencia, que utiliza los centroides que se encuentran en la ecuacin 1 para calcular el grado de relevancia de cada registro para el grupo. Se obtiene una muestra restringida filtrando los registros, ajustando un umbral del grado de pertenencia y normalizndolo.

 

Modelado

Es un algoritmo de aprendizaje difuso no supervisado que asigna grados de membresa a cada uno de los puntos de datos. La estructura del algoritmo agrupa a los clientes por sus preferencias, gustos y necesidades relacionadas expectativas de los productos de inters. En el entrenamiento de este modelo se recomiendan productos segn las compras de los clientes con menor distancia calculada por el mtodo knn que se aplica en la Ecuacin 3, creando tres clusters Figura 3 que posteriormente para aumentar la precisin se aplica el mtodo C Means que caracteriza la participacin de cada muestra en todos los grupos utilizando funciones de pertenencia que toman valores entre cero y uno, lo cual indicara que los valores cercanos a uno indican una mayor similitud, mientras que los cercanos a cero indican una menor similitud, de esta manera se obtiene una particin difusa optima otorgando un grado de membresa a cada punto de datos.

 

Motor de Recomendacin

En esta fase las preferencias, gustos y necesidades del cliente sobre los productos son considerados mediante la aplicacin que usa un algoritmo difuso que asocia las caractersticas del historial de compra de los clientes. De esta forma estas caractersticas mediante reglas de asociacin se guardan en la memoria del motor de Recomendacin. All estas caractersticas sufren una modificacin previa segn las preferencias en compras anteriores, en caso de no hallar similitud con compras anteriores se dirige al modelo borroso para agruparlo al grupo que potencialmente pertenece con un grado de membresa que indican el grado en que cada punto de datos pertenece a cada grupo. Supongamos que en la bsqueda de los grados de membresa tenemos estos valores 0.40, 0.74, 0.32, claramente podemos determinar que el grado de pertenencia se encuentra en el clusters 2. Una vez identificado el grado de pertenencia del perfil de los clientes se filtran las recomendaciones aplicando la funcin test y aplicando el algoritmo KNN calculado en la Ecuacin 3. El valor k se fija en siete, y el sistema nos recomienda un top siete de productos que podrn ser consumidos por aplicaciones mviles o pginas web.

 

Resultados

La investigacin se realiz con la informacin de los clientes de la empresa Promyvent la cual se dedica a distribuir una gran variedad de productos en distintos cantones de la provincia de Manab Figura 1, teniendo as una extensa cartera de clientes, cada uno con preferencias gustos y necesidades distintas, se utiliz el 100% de datos de los clientes de la base de datos de la empresa y los registros de compra de todos los clientes como se observa en la Tabla 2, estos datos se los traslad y almaceno en una hoja de clculo de Excel extensin CVS para posteriormente estos datos sean manipulados por el software Phyton con mayor facilidad.

Como resultado de esta investigacin se pudo recomendar un top siete de productos de acuerdo a el perfil de cada cliente, la recomendacin se podr utilizar mediante el uso de aplicaciones mviles o pginas web que ayudaran a mejorar el desempeo de los vendedores en el proceso de ventas, cabe destacar que las tcnicas y modelos aplicados son dinmicos, es decir que el desempeo de la recomendacin vara dependiendo de los registros histricos de cada cliente, pues este puede ir evolucionando con el tiempo y las nuevas tendencias.

Los resultados en el proceso mediante la utilizacin de algoritmos de Agrupacin KNN (vecino ms cercano) y C Means establecen la precisin del modelo en base a los registros histricos de compras de los clientes para poder identificar el grado de membresa que tiene cada cliente de acuerdo a su perfil y poderlo clasificar a un determinado cluster, cada cliente es encasillado dependiendo del tipo de clase que sean los vecinos ms prximos a l y que generalmente su similitud es medida mediante una funcin de distancia Euclidiana o Manhattan como podemos observar en la Figura 5 que un cliente de acuerdo a sus caractersticas fue encasillado en el clusters 2, luego esta informacin se filtra de acuerdo al perfil de cada cliente recomendando un top siete de productos de inters el cual lo hemos representado en una nube de palabras la cual brinda un anlisis fcil, rpido y comprensivo de los datos en el cual los nombres de los productos recomendados aparecen ms grandes y de distinto color como se aprecia en la Figura 6. Tambin se estableci en base a la frecuencia del historial de compras de cada cliente un top diez de productos ms vendidos y con mayor aceptacin permitiendo de esta manera que la empresa pueda conocer cules son los productos con mayor rotacin en el mercado y as poder tomar una mejor decisin al ofrecer el producto a su cliente como se ilustra en la Figura 7. Con el uso de 6 variables y 8000 registros, los datos fueron pre procesados mediante el uso algoritmo de aprendizaje difuso no supervisado.

 

 

 

 

 

 

 

 

Figura 6: Registro de Compras de Clientes

 

Figura 7: C Medias Grado de Membresa

 

Figura 8: Nube de Palabras: Recomendacin de Productos

 

Figura 9: Top 10 de Productos de mayor rotacin

 

Conclusin

En el estado de arte establece que las tecnologas basadas en la Inteligencia Artificial (IA) ya estn siendo utilizadas para ayudar a los humanos a beneficiarse de mejoras significativas y disfrutar de una mayor eficiencia en casi todos los mbitos de la vida, de modo que en un mercado globalizado es necesario que las empresas busquen soluciones basadas en las nuevas tecnologas, por esta razn la tecnologa de los sistemas de recomendacin es una parte importante debido a que puede brindar un mejor servicio a los usuarios y ayudarlos a obtener informacin en cualquier momento y en cualquier lugar.

La fase del pre procesamiento de datos es esencial en todo proceso, debido a que en esta fase se identifica valores atpicos que pueden alterar resultados y propiedades de los datos.

Uno de los inconvenientes que tuvimos en el desarrollo de esta investigacin fue que las frecuencias absolutas arrojaban muchos tems de productos con pocos valores lo cual dificultaba la presentacin de los valores de la recomendacin, por lo cual utilizamos una nube de palabras para hacer un grfico con una mejor presentacin.

El modelo implementado beneficia a la empresa no solo a recomendar un top siete de productos de inters de acuerdo al perfil del cliente si no tambin identificar los productos que tienen mayor y menor rotacin de inventario, esto permite a la empresa lanzar campaas de marketing con los productos que menos acogida tienen entre los clientes. En esta investigacin se implement un sistema de recomendacin difuso el cual fue probado y ejecutado a la base de datos de clientes de la empresa Promyvent.

En trabajos futuros este modelo de recomendaciones planteado puede ser ms ptimo y obtener mejores resultados si la empresa implementa un sistema que permita a los clientes valorar los productos lo que permitir optimizar el algoritmo y obtener resultados ms precisos.

Este modelo de recomendaciones tambin se lo puede aplicar en otras reas de la empresa como en departamentos crdito, marketing, Inventarios, entre otros para impulsar su desarrollo.

 

Referencias

1.      Altamirano, K. L. (2020). Innovacin en empresas de Cuenca-Ecuador: Empleo de modelstica inteligente en el sector textil. Revista de ciencias sociales, 26(3), 148-162.

2.      Askari, S. (2021). Algoritmo de agrupamiento Fuzzy C-Means para datos con tamaos de clster desiguales y contaminados con ruido y valores atpicos: revisin y desarrollo. Sistemas expertos con aplicaciones, 165 , 113856.

3.      Camino, R. C. (2017). Emprendimiento e innovacin en Ecuador, anlisis de ecosistemas empresariales para la consolidacin de pequeas y medianas empresas. INNOVA Research Journal, 2(9.1), 73-87.

4.      Charnelli, M. E. (2017). Sistema recomendador basado en tpicos latentes. In Congreso Argentino de Ciencias de la Computacin, Vol 23.

5.      Chesevar, C. I. (2018). El comercio electrnico en la era de los bots. Universidad Nacional del Sur y CONICET, 126-135.

6.      Choenyi, T. T. (2021). A review on the filtering techniques used in the restaurant recommendation system. In t. J. Computation. Science Crowd. Compute, 10 (4), 113-117.

7.      Chuya, J. C. (2021). Economa digital, herramienta para mejorar la competitividad y productividad en las PYMES caso: Machala-Ecuador. 593 Digital Publisher CEIT, 6(3), 76-86.

8.      Costa, M. P. (2018). Inversin en TICS en las empresas del Ecuador para el fortalecimiento de la gestin empresarial Periodo de anlisis. Revista Espacios, 39(47).

9.      Cuenca Mogro, E. M. (2019). Investigacin y anlisis de sistemas de recomendaciones basados en reglas y Fuzzy para el control de la diabetes sobre artculos cientficos y sistemas existentes. Universidad de Guayaquil. Facultad de Ciencias Matemticas y Fsicas., Guayauil.

10.  Cui, Z. X. (2020). Sistema de recomendacin personalizado basado en filtrado colaborativo para escenarios IoT. IEEE Transactions on Services Computing , 13 (4), 685-695.

11.  de la Maza, L. L. (2019). Anlisis de componentes principales aplicado a la fermentacin alcohlica. Revista Cientfica de la UCSA, 6(2), 11-19.

12.  De-La-Hoz, E. J.-L.-H. (2019). Metodologa de aprendizaje automtico para la clasificacin y prediccin de usuarios en ambientes virtuales de educacin. Informacin tecnolgica, 30(1), 247-254.

13.  Esteban, I. G. (2017). Fundamentos y tcnicas de investigacin comercial. Esic Editorial.

14.  Flores Macalup, L. E. (2022). Una introduccin a la clasificacin difusa. Una introduccin a la clasificacin difusa. Universidad Nacional de Piura, Piura.

15.  Gallego, L. &. (2019). Variables de influencia en la capacidad de aprendizaje. un anlisis por conglomerados y componentes principales. Informacin tecnolgica, 30(2), 257-264.

16.  Gmez, P. G. (2019). Sistemas de Recomendacin: un enfoque a las tcnicas de filtrado. Revista Ibrica de Sistemas e Tecnologias de Informao, 286-293.

17.  Gonzlez, J. &. (03 de 2018). Innovacin tecnolgica en las empresas. Observatorio de la Economa Latinoamericana.

18.  Holguera, F. P. (2021). Sistemas de recomendacin basados en filtrado colaborativo:: aceleracin mediante computacin reconfigurable y aplicaciones predictivas sensoriales. Universidad de Extremadura.

19.  Jara, A. A. (2017). Evaluacin comparativa del sistema de control interno del sector comercial y del sector pblico del Cantn Morona. Killkana sociales: Revista de Investigacin Cientfica, 1(1), 31-38.

20.  Kaushik, A. G. (2018). Una recomendacin de pelcula. Sistema utilizando Redes Neuronales. Revista internacional de investigacin avanzada, ideas e innovaciones en tecnologa, 4 (2), 425-430.

21.  Keerthana, T. B. (2021). Sistema de recomendacin de productos Flipkart. Journal of Engineering Sciences, 33 , 34.

22.  Kishnani Garca, S. F. (2020). Uso de TIC y el desempeo laboral en empresas de comercio en Lima Metropolitana. Universidad San Ignacio de Loyola, Lima.

23.  Maillo, J. L. (2018). Un enfoque aproximado para acelerar el algoritmo de clasificacion Fuzzy kNN para Big Data. Asociacin Espaola para la Inteligencia Artificial (AEPIA)., (pp. 1143-1148).

24.  Mero-Vlez, J. M. (2018). Empresa, administracin y proceso administrativo. Revista Cientfica FIPCAEC (Fomento de la investigacin y publicacin en Ciencias Administrativas, Econmicas y Contables). ISSN: 2588-090X. Polo de Capacitacin, Investigacin y Publicacin (POCAIP), 3(8), 84-102.

25.  Morales, C. A. (2018). Algoritmo SVD aplicado a los sistemas de recomendacin en el comercio. Tecnologa Investigacin y Academia, 6(1), 18-27.

26.  Nainggolan, R. P.-a. (2019). Se mejor el rendimiento del clster de K-means utilizando la suma de errores cuadrticos (SSE) optimizada mediante el uso del mtodo Elbow. En Journal of Physics: Conference Series, (Vol. 1361, No. 1, p. 012015).

27.  Pacheco Pazmio, H. W. (2018). Estudio de algoritmos de filtrado basado en contenidos para sistemas recomendadores de in formacin. Universidad Tcnica de Cotopaxi: Facultad de Ciencias de la Ingeniera y Aplicadas)., Latacunga.

28.  Padmanandam, K. B. (2021). Una visualizacin de nube de palabras dinmica con reconocimiento de voz para resmenes de texto. En 2021 6th International Conference on Inventive Computation Technologies (ICICT) IEEE., (pp. 609-613).

29.  Prez, S. C. (2018). Anlsis, diseno y desarrollo de un sistema de recomendacin basado en datos restauranteros de TripAdvisor y Foursquare. Research in Computing Science, 147, 209-224.

30.  Pita, G. E. (2018). Las TICs en las empresas: evolucin de la tecnologa y cambio estructural en las organizaciones. Dominio de las Ciencias, 4(1), 499-510.

31.  Polo Otero, J. L. (2017). Relacin entre I+ D, actividades innovadoras y resultados empresariales: un anlisis para el sector de alimentos y bebidas en Colombia. Dimensin Empresarial, 15(1), 175-197.

32.  PRIETO, J. E. (2018). Los beneficios de la inteligencia artificial en el sector empresarial. Los beneficios de la inteligencia artificial en el sector empresarial. UNIVERSIDAD SANTO TOMAS, Bogota.

33.  Proao, M. F. (2018). Los sistemas de informacin y su importancia en la transformacin digital de la empresa actual. Revista Espacios, 39(45).

34.  Rouhiainen, L. (2018). Inteligencia artificial. Madrid: Alienta Editorial.

35.  Sellars, B. S.-A. (2018). Uso de nubes de palabras para analizar datos cualitativos en entornos clnicos. Gestin de enfermera, 49 (10), 51-53.

36.  Umargono, E. S. (2020). Optimizacin de agrupamiento de K-medias utilizando el mtodo del codo y la determinacin temprana del centroide en funcin de la media y la mediana. En Actas de las Conferencias Internacionales sobre Sistemas y Tecnologas de la Informacin-CONRIST, (pp. 234-240).

37.  Yera, R. y. (2017). Herramientas difusas en sistemas de recomendacin: una encuesta. Revista Internacional de Sistemas de Inteligencia Computacional, 10 (1), 776-803.

 

 

 

2022 por los autores. Este artculo es de acceso abierto y distribuido segn los trminos y condiciones de la licencia Creative Commons Atribucin-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0)

(https://creativecommons.org/licenses/by-nc-sa/4.0/).x

 

Enlaces de Referencia

  • Por el momento, no existen enlaces de referencia




Polo del Conocimiento              

Revista Científico-Académica Multidisciplinaria

ISSN: 2550-682X

Casa Editora del Polo                                                 

Manta - Ecuador       

Dirección: Ciudadela El Palmar, II Etapa,  Manta - Manabí - Ecuador.

Código Postal: 130801

Teléfonos: 056051775/0991871420

Email: [email protected][email protected]

URL: https://www.polodelconocimiento.com/

 

 

            



Top