Entrevista: Francisco Marotta, director tecnológico de preciosNinja

Entrevista: Francisco Marotta, director tecnológico de preciosNinja

En la entrevista de hoy tenemos con nosotros a Francisco Marotta, de PreciosNinja.com. Francisco es Ingeniero Informático y experto en business intelligence. A través de su experiencia como emprendedor, nos estará contando todo sobre cómo es hoy en día el trabajo que se realizar a nivel de datos en una startup.

 

precios ninja entrevista

 

Hará cosa de 2 años, Francisco se embarcó en la aventura del emprendimiento junto a su amigo Marcos Ford, iniciando lo que hoy en día es unos de los e-commerce con mejor perspectiva del momento. Y si no me creen, les anticipo que PreciosNinja estará presente en campus party 2016, uno de los eventos de tecnología más importantes a nivel mundial.

PreciosNinja es un e-commerce, y como los monstruos del sector, llámese Amazon, eBay o Mercado Libre, debe gestionar inteligentemente la información que obtiene de sus clientes a fin de poder prestarles estos el mejor servicio.

Para lograr esto, toda web debe contar con una plataforma de datos sólida y escalable. ¿Cómo saber lo que un usuario desea en base a lo que adquirió en sus comprar previas? ¿Cómo agrupar clientes por sus características? ¿Cómo definir si un elemento de la landing page aumenta el nivel de conversión de los visitantes? Todas estas preguntas y muchas más son las que se realizan a diario gente tanto del mundo del marketing como data scientist, pero ni unos ni otros pueden responderlas sin datos con que trabajar.

¿Querés conocer en que tecnologías se basa uno de los e-commerce con mejor perspectiva del momento, y las que utilizan las referentes del sector? Francisco te lo cuenta en esta entrevista.

 

Francisco Marotta, de PreciosNinja.com

Francisco Marotta, de PreciosNinja.com

 

Presentación


 

¿Quién eres, de qué se trata PreciosNinja y cómo es el perfil de clientes a los que apuntan?

Mi nombre es Francisco Marotta. Tengo 30 años, oriundo de Buenos Aires y fanático del fútbol. Vivo solo, aunque desde hace unos años estoy en pareja.

En lo profesional, soy ingeniero en informática y me dedico a hacer consultoría en business intelligence. Junto a esto, soy co-fundador de PreciosNinja, un e-commerce que se diferencia del resto en la en la mecánica para generar ofertas a los usuarios. En este, a través de una serie de algoritmos que hemos programado y un amplio grupo de proveedores, buscamos generar la mejor oferta para los usuarios sin que estos deben realizar ningún esfuerzo. En particular, nos enfocamos en productos de tecnología.

Respecto de mis tareas en PreciosNinja, me focalizo en todo lo relativo al desarrollo de la plataforma, aunque como en cualquier startup, estoy involucrado, de alguna manera, en todas las áreas de trabajo.

A propósito, quiero mencionar que estamos siendo acelerados por la incubadora de startups: Scalabl.

 

Cuéntanos del tiempo que llevan trabajando en PreciosNinja, y cual es el factor que ha impulsado su crecimiento en los últimos 6 meses

Llevamos trabajando en PreciosNinja más de dos años. Durante este tiempo, hemos pasado por periodos difíciles pero poco a poco hemos comenzado a crecer. Creo que nuestras primeras ventas fueron de los eventos más significativos que tuvimos. Estas nos permitieron validar las hipótesis que veníamos manejando respecto de nuestra propuesta de valor. Es más, creo que los primeros clientes, los early adopters, son fundamentales para cualquier startup por ser quienes prueban que se está haciendo algo realmente significativo.

En estos momentos estamos en la víspera de un gran evento: Campus Party. Es el evento global más importante en lo referente a tecnología, innovación y emprendimiento. Nos enorgullece haber sido seleccionados para formar parte de esto, y a su vez nos confirma el gran momento que estamos pasando. Sentimos que nos va a dar una visibilidad enorme, y esperamos aprovechar para dar el próximo salto de modo de llegar a un público más masivo.

 

Plataforma


 

Veo que PreciosNinja tiene un diseño muy atractivo, y una idea muy interesante sobre la que se basa para generar ofertas. ¿Qué tecnología han empleado para montar el sitio?

Por el momento estamos en una fase de prototipo, o MVP (del ingles Minimum Viable Product). Cuando comenzamos, necesitábamos un rápido desarrollo que fuera representativo de nuestra propuesta de valor, por ende hemos utilizado las tecnologías que más rápido nos permitieron agilizar la implementación y puesta a prueba de nuestro producto, independientemente que a futuro no sean las que pensamos terminar utilizando.

Dicho esto, el backend ya lo hemos resuelto con varios algoritmos de procesos que nos permiten llevar a cabo nuestra operatoria de manera más sencilla. En cuento al frontend, aplicamos prácticas estándares para facilitar el uso del sitio.

 

En base a la información que almacenan, ¿Cuáles son las principales métricas que utilizan para tomar decisiones? ¿Qué técnicas o herramientas son necesarias para esto?

Es muy importante para nosotros entender los ratios de conversiones que tenemos, es decir, poder saber de los usuarios que alcanzamos con publicidad, cuales entran a nuestro sitios de manera orgánica, cuántos terminan haciendo la compra, cuántos cancelan su compra en el carro de compras antes de terminar el checkout, cuántos hacen click en los artículos del panel, etc. Nuestro objetivo es ver formas de mejorar la conversión y lograr que más gente pueda aprovechar nuestros productos.

Hay muchas herramientas útiles para llevar a cabo este tipo de análisis que estamos utilizando. Recomendamos: Google Analytics, pixel de Facebook y HotJar.

 

¿Qué deseo tienen en cuanto al uso que les puedan dar a los datos que recogen de acá a unos años?

Una idea que tenemos para un futuro, con deseos que sea en el próximo año o dos años, es poder aplicar algoritmos de data mining más sofisticados para poder predecir que podría pedir un usuario en base a sus compras previas y los artículos que fue viendo, y así enviar ofertas personalizadas a los mismos antes de que se haga el pedido del producto.

 

Una poco de data science


 

Siempre escucho hablar de Big Data esto, Big Data lo otro… ¿Podrías aclararnos que es esto del Big Data y como afecta el comercio electrónico?

El Big Data hace referencia a actividades de análisis de grandes volúmenes de datos, cuyo objetivo es en base a estos datos poder hacer predicciones sobre diversas cuestiones. Con Big Data se pueden obtener respuestas de preguntas que uno no sabe sobre su negocio, en contraste con el Business Intelligence en el que uno obtiene respuestas de preguntas que ya tiene.

Esto no solo afecta al comercio electrónico, sino a cualquier negocio en el que uno quiera optimizar las decisiones pensando en los objetivos de la empresa, ya que con buenos datos es más fácil accionar de mejor manera que sin ellos.

 

¿Ustedes utilizan Big Data y algoritmos de Data Mining? ¿Podrías darnos algún ejemplo?

Bueno, lo cierto es que el volumen de información que manejamos no llega a poder considerarse como Big Data. No obstante, esto no impide que hagamos amplio uso de los datos con que contamos. Lamentablemente no puedo darte detalle de que algoritmos y como los utilizamos debido a que queremos mantenerlo privado, pero tampoco de voy a dejar con las manos vacías.

Te voy a dar un ejemplo. Últimamente hemos estado haciendo pruebas de agrupación de usuarios y producto utilizando K-means. Este algoritmo es bastante simple de aplicar, y nos provee de grupos de usuarios que poseen ciertas características que nos permite vincularlos con los productos que suelen buscar, y como es su comportamiento al momento de comprar. Aún no tenemos puesto nada en producción utilizando la información que nos entrega el algoritmo, pero tenemos intenciones de hacerlo en algún momento. Lamentablemente hay tareas más urgentes de que ocuparse.

 

Cierre


Bueno, para ir cerrando la entrevista, te hago algunas preguntas orientadas a la gente que reciente está comenzado a incursionar en el mundo de los datos y las startups.

¿Qué consejo le das a una persona que tiene una startup, y no sabe que hacer con los datos que va adquirendo a medida que pasa el tiempo?

Creo que es fundamental que se definan desde el principio objetivos claros y medibles. De esta manera los datos que uno va recopilando deberán servir para contrastar los objetivos que se tengan y así ver si se están logrando las cosas propuestas o no. Una frase que creo pertinente es de Lord Kelvin y claramente explica la importancia de setear objetivos y medirlos:

“Lo que no se define no se puede medir. Lo que no se mide, no se puede mejorar. Lo que no se mejora, se degrada siempre” – Lord Kelvin

No es necesario desde el inicio de la startup tener definido un mecanismo de toma de datos perfecto, pero sí es necesario saber la importancia de los datos y al menos hacer recopilaciones manuales de los mismos, para poder así medir el cumplimiento de las metas definidas.

 

¿Qué herramientas recomiendas para comenzar a analizar datos para un novato, y para un no tan novato?

Para la visualización y análisis de los datos recomiendo herramientas como QlikView o Tableau. Ambas pueden ser utilizadas de manera básica para un principiante, como de manera profunda para un conocedor de las mismas.

 

¿Algo más quieras agregar?

Muchas gracias por el espacio que brindado, fue un gusto. Y quiero dejarles una reflexión más respecto de emprender, que me parece clave:

“Perseverancia mata galán!”

Adiós 🙂

 

 

Comentarios
Escalas de medición y variables en estadística

Escalas de medición y variables en estadística

En estadística se estudian datos. Los datos son la representación de atributos o variables que describen hechos, y al analizarlos y procesarlos, estos se transforman en Información. Para poder hacer esto, es necesario comparar los datos entre sí y respecto de referencias. Este proceso de comparación requiere de escalas de medición donde situar cada posible valor que tomen los datos, y por las diferentes características de estos, existen diferentes tipos de escalas. En la primera parte del post hablaremos sobre las escalas de medición en estadística.

Luego, tenemos a las variables. En general, en la mayoría de las materias que tuvimos en el colegio o en la facultad, utilizamos variables para representar las características de elementos que deseamos estudiar cuando estas cambian según algún parámetro. En la segunda parte del post veremos cómo se clasifican a las variables que utilizamos en estadística.

 

escalas de medición en estadística

 

Escalas de medición en estadística


Como hemos dicho, para que los datos tengan sentido es necesario compararlos. Y para poder compararlos debemos utilizar escalas de medición. Dichas escalas tendrán diferentes propiedades en función de las características de los datos que se compararán. En estadística existen cuatro escalas de medición: nominal, ordinal, de intervalo y de razón.

 

Escala nominal

Cuando un dato identifica una etiqueta (o el nombre de un atributo) de un elemento, se considera que la escala de medición es una escala nominal. En esta carecen de sentido el orden de las etiquetas, así como la comparación y las operaciones aritméticas. La única finalidad de este tipo de datos es clasificar a las observaciones. Ejemplo:

Una variable que indica si el visitante de este post es «hombre» o «mujer».

En esta variable se tienen dos etiquetas para clasificar a los visitantes. El orden carece de sentido, así como la comparación u operaciones aritméticas.

 

Escala ordinal

Cuando los datos muestran las propiedades de los datos nominales, pero además tiene sentido el orden (o jerarquía) de estos, se utiliza una escala ordinal. Ejemplo:

Una variable que mide la calidad de un post. La variable puede tomar valores enteros del 1 al 5, donde el valor 1 es el peor y el 5 el mejor.

En esta variable sigue sin tener sentido las operaciones aritméticas, pero ahora sí tiene sentido el orden. Si un post tiene valor 4 y otro tiene valor 2, el primero se entiende que es mejor que es segundo.

 

Escala de intervalo

En una escala de intervalo, los datos tienen las propiedades de los datos ordinales, pero a su vez la separación entre las variables tiene sentido. Este tipo de datos siempre es numérico, y el valor cero no indica la ausencia de la propiedad. Veamos un ejemplo:

La temperatura (en grados centígrados) media de una ciudad.

En esta escala, los número mayores corresponden a temperaturas mayores. Es decir, el orden importa, pero a la vez la diferencias entre las temperaturas importa.

 

Escala de razón

En una escala de razón, los datos tienen todas las propiedades de los datos de intervalo, y la proporción entre ellos tiene sentido. Para esto se requiere que el valor cero de la escala indique la ausencia de la propiedad a medir. Ejemplos de este tipo de variables son el peso de una persona a el tiempo utilizado para una tarea. Ejemplo:

Una variable que mide el salario de una persona.

En esta variable, si una persona gana 100, y otra 10, la primera gana más que la segunda (comparación). También tiene sentido decir que la primera gana 90 más que la segunda (diferencia), o que gana 10 veces más (proporción).

 

Variables en estadística


Las variables se las suele dividir según distintos criterios, en función las características de los valores que estas puedan tomar.

 

Variables cuantitativas y cualitativas

De acuerdo al tipo de escala que se utilizan se puede clasificar en cualitativas o cuantitativas.

Las variables cualitativas son aquellas que se usan para identificar un atributo de un elemento. Se emplean con la escala nominal o la ordinal, y pueden ser numéricos o no. Los datos contenidos en estas variables se resumen contando el número de observaciones de cada valor que toma la variable, o la proporción en entre estos. Un hecho importante a tener en cuenta es que, aun cuando para los datos cualitativos se use un código numérico, las operaciones aritméticas como la suma o la multiplicación no tienen sentido. Ejemplo:

El color de un auto.

Luego, las variables cuantitativas son aquellas que requieren valores numéricos para definir los datos. Se emplean con las escalas de medición de intervalo o de razón. En estas sí tienen sentido las operaciones aritméticas. Ejemplo:

La altura de una persona.

En general hay más alternativas para el análisis estadístico cuando se tienen variables cuantitativas que con las variables cualitativas.

 

Variables continuas y discretas

El siguiente criterio de clasificación (solo para variables cuantitativas) es según como es el conjunto de valores sobre el cual estas pueden tomar valores.

Una variable continua puede tomar valores dentro de un intervalo continuo, es decir, dado dos puntos de un intervalo, la variable siempre podrá tomar infinitos valores entre ambos puntos. Ejemplo:

La temperatura en una habitación.

En cambio, una variable discreta solo puede tomar valores sobre un conjunto finito de valores o un conjunto infinito numerable (un conjunto infinito, pero cuyos elementos se pueden contar). En otras palabras, no puede tomar valores sobre cualquier punto del intervalo, sino solamente sobre aquellos incluidos en el conjunto al que pertenece. Esto hace que surja el concepto de valores observados sucesivos, lo cual significa que, dado una observación, puede existir una observación previa y otra posterior. Ejemplo:

Cantidad de años de vida de una persona.

 

Datos de sección transversal y de series de tiempo

Por último, otra clasificación típica que se suele realizar sobre los datos es respecto del tiempo en que estos son adquiridos.

Los datos de sección transversal son los obtenidos en el mismo (o aproximadamente) momento.

En un mismo periodo, cual es el PBI de un grupo de paises

 

Sección transversal

 

Los datos de series de tiempo son datos obtenidos a lo largo del tiempo.

El PBI de un país a lo largo de los años

 

Serie de tiempo

 

Comentarios

Presenta tus datos con Power View de Excel en un mapa [Tutorial]

Presenta tus datos con Power View de Excel en un mapa [Tutorial]

Muchas veces nos encontramos con datos que pueden ser posicionados en un mapa. Supongamos que tenemos un registro de ventas de nuestros productos por provincia. Entonces, de alguna forma, queremos poder pintar estos datos en un mapa. La alternativa más simple para poder hacer esto es utilizar un complemento de Excel llamado Power View, el cual entre sus funcionalidades nos ofrece la posibilidad de realizar esto mismo.

Lo que veremos en este post es una introducción a Power View y como pintar datos en un mapa, obteniendo finalmente la siguiente visualización:


Excel Power View Mapa

 

Antes de pasar al video comentemos algunos puntos.

Prefijos telefónicos


En el ejemplo que veremos tenemos una serie de números telefónicos de los cuales podemos, mediante el análisis de sus prefijos, saber a que país y región pertenecen. Esto es así dado que la UIT (Unión Internacional de Telecomunicaciones) recomienda a las diferentes operadoras telefónicas su utilización, la cual es acatada por (hasta donde sé) todas ellas. Por poner un ejemplo, si tenemos la línea +5411XXXXXX, podemos descomponer el número en:

  • +54: Código de país. En este caso, Argentina.
  • 11: Código de región. En este caso, Ciudad de buenos aires y alrededores.
  • X…X: Numero de línea, o de abonado a la red.

De esta forma, si tenemos una lista de números telefónicos podemos extraer la información geográfica de estos. No obstante, se debe ser cuidadoso dado que estos prefijos no tienen longitud fija. Por ejemplo, en el caso de tener una línea de Estados Unidos, tendríamos como prefijo de país +1, y si la línea en concreto es de Nueva York (prefijo 212), esta comenzaría con 1212.

Extracción del prefijo


Luego, para extraer estos prefijos y convertirlos a los nombre de las regiones a las que queremos asociarlos utilizamos una serie de funciones de Excel.

Lo primero es descomponer cada número en sus partes. Para esto utilizamos las funciones IZQUIERDA, EXTRAEDERECHA. Como en este ejemplo solo he puesto líneas de Argentina y de provincias en las que se tienen prefijos compuestos por dos dígitos, esta tarea esa simple. En caso de querer hacer algo más genérico se debería contemplar todos los casos que pueden darse, y utilizar la función SI.

Una vez que tenemos el prefijo de país en una columna y el prefijo de provincia en otra, lo siguiente es crear una tabla con la que cruzar y obtener los nombre correspondiente de la región. Los datos para crear esta tabla los podemos obtener de distintos sitios en Internet. Por ejemplo, para los prefijos de Argentina encontré estos. Una vez generada la tabla, para cruzar los datos utilizamos la función BUSCARV, la cual nos permite encontrar un valor dentro de un rango de datos.

Video: Power View en acción


 

 

Datos para jugar


Y para cerrar el post les dejo la planilla con la que he comenzado en el video. Lo ideal seria que repliquen lo que hemos hecho de modo que tomen practica con Excel. Después de todo, «lo que aprendemos a hacer, lo aprendemos haciendo».

 

Comentarios

Como resumir datos en Excel utilizando barras de error [Caso práctico]

Como resumir datos en Excel utilizando barras de error [Caso práctico]

Ya te habrá pasado infinidad de veces tienes un conjunto de datos en una tabla de Excel. A esto datos los quieres graficar, pero al momento de darle click a un gráfico de dispersión te encuentras con un resultado horroroso. Entonces te ponés a ver cómo mejorar la visualización de los datos, y encuentras que hay gran cantidad de métodos existentes y no sabes con cual quedarte. Lo que te propongo en este post es apoyarnos en las barras de error para resolver casos en que tengamos muchos valores con gran dispersión. La idea básica es que las barras de error representen cierta medida de dispersión, y de este modo poder transformar esto:

 

Gráfico con puntos dispersos

 

En esto otro:

 

Gráfico con barras de error

 

Mucho mejor, no?

En este caso, lo que he hecho es hacer que las barras error representen el intervalo intercuartil en cada punto del eje horizontal. De este modo, estamos indicando que dentro de las barras queda el 50% de las mediciones en torno a la media. Si quisiésemos ser más tolerantes, podríamos ampliar este intervalo, pero para el ejemplo nos basta.

Entonces, antes de pasar al video, comentemos un poco que es esto del intervalo intercuartil. Para esto comencemos definiendo lo que son los percentiles. Supongamos que tenemos un conjunto de datos numéricos y los ordenamos de menor a mayor. El percentil X es el valor de este conjunto tal que el X por ciento de los elementos del conjunto queda debajo de este valor. Luego, se utilizan comúnmente tres valores de percentiles que son el percentil 25, 50 y 75, y que nos dividen el conjunto de datos en 4 partes iguales, llamados cuartiles. Finalmente, el intervalo intercuartil es el que va desde le percentil 25 al 75, de modo que captura el 50% de los elementos en torno a la media mediana (percentil 50).

Y ahora, el video.

 

 

Comentarios

Como analizar datos con gráficos dinámicos de Excel [Caso práctico]

Como analizar datos con gráficos dinámicos de Excel [Caso práctico]

Con el post de hoy, que dicho sea de paso, deja inaugurado este blog, quiero mostrarte todo el potencial que encierran los gráficos dinámicos de Excel. Hay multitud de herramientas que nos sirven para hacer análisis de datos, como R, Python y muchas otras, pero en lo que a practicidad se refiere, el vencedor indiscutible es Excel.

 

graficos dinamicos en Excel

 

Así que, si quieres triunfar en este mundo de datos por doquier, es mejor que tomes dominio de esta joya de Microsoft. No solo te servirá en caso de que trabajes como analista, sino que cualquiera sea tu ocupación te dará un plus para diferenciarte.

Entonces, la idea es que partamos de cero con un archivo que contiene registros de ventas. Este archivo lo he preparado simulando casos reales que se pueden presentar en cualquier empresa. Lo que haremos primero es darle una mirada con un editor de texto, yo uso notepad++, y luego, una vez que nos aseguremos que el formato y el tamaño son aptos para ser trabajado en Excel, pasar a este.

Respecto del tamaño, debemos tener en cuenta que Excel, en versiones posteriores a 2010, maneja un máximo de 1.048.579 (2^20) filas por hoja, es decir, si nuestro archivo contiene más filas que este valor debemos arreglarnos de alguna manera para trabajar. Una solución sería ver si hay forma de agrupar estos registros, dividirlos en varias hojas, o directamente utilizar otra herramienta.

Finalmente, debemos tener siempre presente el formato, dado que Excel tiene la costumbre de formatear cada columna según su criterio. Normalmente este criterio es correcto, pero a veces no. Allí es cuando perdemos mucho tiempo frente al monitor, porque no les encontramos el sentido que a priori deberían tener dichas columnas, o peor aún, las mal interpretamos.

Con estas consideraciones en mente, y sin más que agregar, les dejo el video demostrativo.

 

 

Y para cerrar el post les dejo el archivo que he usado en el video. Lo ideal seria que repliquen lo que hemos hecho de modo que tomen práctica con Excel. Después de todo, «lo que aprendemos a hacer, lo aprendemos haciendo».

 

Comentarios