Header Ads Widget

Ticker

6/recent/ticker-posts

R vs Python

Para una gran cantidad de personas, el análisis de datos es una de las partes más importantes de su trabajo. La mayor disponibilidad de datos ha hecho que la informática sea más poderosa y la necesidad de una decisión basada en análisis en las empresas ha puesto la ciencia de datos en el centro de atención. Según un informe de IBM , en 2015, hubo 2,35 millones de vacantes para trabajos de análisis de datos en los EE. UU. Se espera y se estima que para 2020, el número se eleve a 2,72 millones. A IBM le gusta llamarlo "The Quant Crunch".
En la era actual, los lenguajes de programación como R y Python han tenido una gran demanda, especialmente en esta búsqueda de la ciencia de datos. Ambos se desarrollaron a principios de la década de 1990. R era principalmente para análisis estadístico y Python era más bien un lenguaje de propósito general. Ahora la gran pregunta es cuál deberíamos aprender para alguien que esté interesado en el aprendizaje automático o en grandes conjuntos de datos: ¿Python o R? En este artículo, responderemos esta pregunta considerando todos los aspectos de ambos idiomas.

Presentamos Python y R

Python y R son lenguajes de programación de código abierto y de última generación. Ambos lenguajes están orientados a la ciencia de datos. Aprender los dos sería una solución ideal. Pero dado que vamos a hacer una comparación, separemos ambos módulos de idioma en función de sus respectivas cualidades.

Pitón

Python, que también se conoce como la navaja suiza de la codificación, es un lenguaje de programación de alto nivel de uso general que se centra en la versatilidad y una programación más limpia.
Es fácil de usar y facilita la replicabilidad y accesibilidad que R. Python se utiliza principalmente en el campo de la inteligencia artificial y el desarrollo de juegos.

R

Es básicamente un lenguaje de programación de bajo nivel utilizado por estadísticos y mineros de datos para desarrollar software estadístico, representaciones gráficas y para análisis de datos. La Fundación R para la Computación Estadística lo ha estado apoyando. R tiene uno de los ecosistemas más ricos de alrededor de 12000 paquetes en el repositorio de código abierto para realizar análisis de datos.

Historia

Pitón

Python no lleva el nombre de la serpiente, sino del programa de televisión británico Monty Python. Influenciado por Modula-3 y sucesor del lenguaje de programación ABC, Python fue implementado en el año 1989 por Guido van Rossum.
Fue lanzado inicialmente en el año 1991 como Python 0.9.0. Python 2.0 y Python 3.0 se lanzaron en el año 2000 y 2008 respectivamente (la última versión de Python es 3.7.3).
Historia de Python y R

R

Ross Ihaka y Robert Gentleman fueron los desarrolladores de R, que es una implementación del lenguaje de programación S creado por John Chambers en 1976. Ihaka y Gentleman lo desarrollaron mientras trabajaban juntos en Nueva Zelanda.
Cuando se lanzó R en 1990, muchos se unieron al proyecto para realizar mejoras. Fue declarado de "código abierto" en el año 1995. La primera versión de R se lanzó al público en el año 2000.

Caracteristicas

R

R es un lenguaje de programación gratuito y se considera el mejor, ya que la mayoría de los lenguajes estadísticos no tienen precio.
Cubre una amplia gama de paquetes que se utilizan en varios campos, comenzando por la computación estadística, la genómica, el aprendizaje automático, las finanzas, la medicina, etc.
Enumeremos algunas características clave de R -
  • Muchas técnicas: es un lenguaje de programación bien desarrollado que abarca una amplia gama de técnicas como modelado lineal y no lineal, agrupamiento, clasificación, etc.
  • Cálculos de matrices y vectores: R admite aritmética de matrices y sus estructuras de datos contienen listas, matrices, vectores y matrices.
  • Cumplimiento - Cumple con otros lenguajes de programación como C, C ++ o Java y permite la comunicación con paquetes estadísticos (SAS y SPSS).
  • Large Community -  R tiene una comunidad progresiva que influye en sus modificaciones, lo que permite que R se ejecute en casi cualquier sistema operativo, incluidos Windows y Linux.

Pitón

Python es un lenguaje interpretado de alto nivel y es extremadamente versátil. Es un nombre que se puede escuchar entre las personas que aman trabajar con datos.
Según el índice de la comunidad de programación TIOBE, Python es el tercer lenguaje más popular de 2019 después de Java y C.
Enumeremos cinco razones importantes por las que Python es el lenguaje para todos.
  • Legibilidad y mantenimiento: Python se centra en la calidad del código fuente y permite al usuario mantener las actualizaciones con facilidad. Puede expresar claramente sus conceptos en Python sin ningún código adicional. Puede utilizar palabras sencillas en inglés que mantengan una buena legibilidad.
  • Múltiples modelos de programación:  Python admite varios paradigmas de programación. La programación estructurada y orientada a objetos está en su dominio principal. Tiene un sistema de tipo dinámico y gestión automática de memoria.   
  • Compatibilidad: Python le permite ejecutar su código en diferentes plataformas sin ninguna recompilación. Esto significa que después de realizar cualquier cambio en su código, no necesita compilarlo una y otra vez en múltiples plataformas. Puede ver claramente el impacto que tiene en su código, después de las modificaciones. La compatibilidad del código aumenta el tiempo de desarrollo.
  • Biblioteca robusta:  Python tiene una biblioteca de paquetes enormemente grande. Puede insertar funcionalidad en su aplicación. Existen modelos específicos para tareas específicas como administrar redes de sistemas operativos, implementar servicios web o trabajar con protocolos de Internet.
  • Marco de código abierto:  Python es un lenguaje de programación de código abierto y contiene una amplia gama de marcos y herramientas de desarrollo de Python que reducen el tiempo de desarrollo sin ningún cambio en el costo de desarrollo. Algunos de los marcos web de Python son Django, Pyramid, Bottle y Cherrypy.
Puedes aprender las características de Python aquí .
A continuación se muestran dos imágenes que muestran la diferencia en el código para mostrar "Hola mundo" en Python y R.
Código para mostrar "Hola mundo" en Python
Código para mostrar "Hola mundo" en R

Instrucciones de configuración e instalación

Pitón

Para ventanas-
Paso 1:  Abra cualquier navegador y vaya a https://www.python.org/
Paso 2: haga clic en la opción Descargas. Verá la última versión de Python (que es Python 3.7.3 y también estable).
Paso 3:  Haga clic en la opción "Descargar Python 3.7.x".
Paso 4:  El archivo llamado “Python-3.7.x.exe” debería comenzar a descargarse en su carpeta de descarga estándar.
Paso 5: Después de descargarlo, vaya a la carpeta especificada y ejecútelo. Continúe con el proceso de instalación. Después de unos minutos más o menos, tendrá su Python IDLE ejecutándose en su computadora.
Para MacOS:
Paso 1:  Abra cualquier navegador y vaya a https://www.python.org/
Paso 2: haga clic en la opción Descargas. Verá la última versión de Python (Python 3.7.3).  
Paso 3:  Haga clic en la opción "Descargar Python 3.7.x".
Paso 4:  El archivo llamado "Python-3.7.x.pkg" debería comenzar a descargarse en su carpeta de descarga estándar.
Paso 5:  Después de descargarlo, vaya a la carpeta especificada y ejecútelo. Continúe con el proceso de instalación. Después de unos minutos más o menos, tendrá su Python IDLE ejecutándose en su computadora.
Instalación de Python

R

Para ventanas-
Paso 1: Abra cualquier navegador de Internet y vaya a www.r-project.org .
Paso 2: Haga clic en el enlace "descargar R" en el medio de la página en "Introducción".
Paso 3: Seleccione una ubicación CRAN y haga clic en el enlace correspondiente.
Paso 4: Haga clic en el enlace "instalar R por primera vez" en la parte superior de la página.
Paso 5: Haga clic en "Descargar R para Windows" y guarde el archivo en su computadora. Ejecute el archivo .exe y siga las instrucciones de instalación a partir de entonces.  
Para MacOS:
Paso 1: Abra cualquier navegador de Internet y vaya a www.r-project.org .
Paso 2: Haga clic en el enlace "descargar R" en el centro de la página en "Introducción".
Paso 3: seleccione una ubicación CRAN (un sitio espejo) y haga clic en el enlace correspondiente.
Paso 4: Haga clic en el enlace "Descargar R para (Mac) OS X" en la parte superior de la página.
Paso 5: haga clic en el archivo que contiene la última versión de R en "Archivos".
Paso 6: Guarde el archivo .pkg, haga doble clic en él para abrir y siga las instrucciones de instalación a partir de entonces.

Distribuciones

Tanto R como Python tienen una distribución común libre y de código abierto: Anaconda. Sus funciones principales incluyen aplicaciones de aprendizaje automático, procesamiento de datos a gran escala, análisis predictivo y ciencia de datos.
La distribución de Anaconda consta de alrededor de 1400 paquetes de ciencia de datos populares, incluido Anaconda Navigator, una interfaz gráfica de usuario (GUI) de escritorio que permite a los usuarios iniciar aplicaciones y administrar el paquete conda.
Algunos de los IDE de Python de uso común son:
IDE de Python de uso común
  • PyCharm
  • Spyder
  • Thonny
Algunos de los IDE de R de uso común son:
  • Estudio R
  • Visual Studio para R
  • Eclipse

¿Qué idioma elegir para aprender de estos dos?

Si tienes experiencia en programación, ¿cuál es mejor para aprender, R o Python?

Si ha reunido algunos conocimientos sobre programación, Python es el lenguaje para usted. La sintaxis de Python es muy similar a la de otros lenguajes en comparación con la sintaxis de R.
R tiene un tipo de código no estandarizado que puede ser una dificultad para las personas que son nuevas en la programación. Por otro lado, Python es mucho más legible y se centra en la productividad del desarrollo.

¿Qué es mejor, R o Python, si quieres entrar en la industria o en la academia?

R es un lenguaje de programación estadística que se utiliza principalmente en el sector académico. Pero la verdadera pregunta es ¿cuál está listo para la industria?
Si consideramos esto, Python sería una mejor opción. Las organizaciones usan Python ampliamente para desarrollar sus sistemas de producción.
Pero desde hace algún tiempo, R ha actualizado sus bibliotecas a código abierto, las industrias también lo están considerando para su trabajo y se está utilizando en gran medida.

¿Qué es mejor para el análisis de datos?

Esta es la pregunta más común que acecha a todos desde hace algún tiempo. Pero antes de llegar a la conclusión, permítame brindarle dos ejemplos.
Considere una situación en la que necesitamos cubrir los datos electorales. Este es un proceso relativamente repetitivo y predecible en el que necesitamos recopilar datos y hacer análisis recurrentes y hacer pasteles y gráficos basados ​​en eso. En este caso, Python facilitará el trabajo.
Ahora, si tomamos el análisis de texto, por ejemplo, donde necesitamos dividir párrafos en frases y palabras y analizar patrones, es mejor hacer uso de R.
En conclusión, podemos decir que Python se usa para trabajos repetidos y manipulación de datos, mientras que R para proyectos estadísticos pesados ​​y situaciones en las que necesitamos sumergirnos en conjuntos de datos únicos.

¿Qué quieres aprender, "aprendizaje estadístico" o "aprendizaje automático"?

El aprendizaje automático entra en la categoría de inteligencia artificial, mientras que el aprendizaje estadístico es un subcampo de la estadística. El aprendizaje automático se centra en el desarrollo de aplicaciones del mundo real y modelos predictivos; mientras que el aprendizaje estadístico hace hincapié principalmente en la precisión y la incertidumbre.
Dado que R fue desarrollado por estadísticos, personas con experiencia en estadística, sería más fácil trabajar con R.
Python, por otro lado, es una mejor opción para aquellos en el departamento de datos donde necesitan realizar análisis y también para aquellos en el sector del aprendizaje automático, especialmente debido a su flexibilidad.

¿Qué idioma aprender si quieres hacer mucho desarrollo web e ingeniería de software?

R sería su elección si desea optar por el desarrollo web. Aunque no es el mejor en comparación con JavaScript o CSS. R le proporciona la biblioteca Shiny mediante la cual se pueden desarrollar sitios web que serán impulsados ​​por R.
Para la ingeniería de software, Python es el indicado. Para un entorno de ingeniería, Python es mejor que R en el espectro más amplio. Sin embargo, es posible que deba utilizar un módulo de bajo nivel como C ++ o Java para una codificación realmente eficiente.

¿Qué lenguaje ayuda a crear visualizaciones de datos hermosas e interactivas, R o Python?

R es siempre una mejor opción para la creación continua de prototipos y el manejo de conjuntos de datos. Las visualizaciones de datos se pueden realizar con R con paquetes de biblioteca como ggplot2, widgets HTML, Leaflet. Aunque Python ha hecho algunos avances con Matplotlib, pero todavía está por detrás de R en esta área.

¿Cuáles son las bibliotecas que ofrece R y Python?

Para la recopilación de datos 

Pitón

Los datos que busca, Python los tiene para usted. Contiene CSV (documentos con valores separados por comas) y JSON (notación de objetos JavaScript) obtenidos de la web. También se pueden insertar tablas SQL en el código.
Python tiene una biblioteca especial llamada biblioteca de solicitudes de Python que simplifica las solicitudes HTTP en una línea de código al permitir datos de sitios web. También contiene bibliotecas para organizar datos y realizar un análisis en profundidad.

R

R no es muy eficiente para recopilar información de sitios web en comparación con Python. Sin embargo, paquetes como Rvest y magrittr se pueden utilizar para raspar, limpiar y desglosar información. También puede insertar datos de CSV, Excel y de archivos de texto en R.

Para la exploración de datos 

Pitón

Pandas es la biblioteca de análisis de datos de Python. Puede trabajar fácilmente con grandes cantidades de datos. Permite al usuario filtrar, organizar y mostrar los datos en un tiempo mínimo.
Mientras trabaja con proyectos, Pandas permite la construcción y reconstrucción de estructuras. Los valores no válidos como Nan (no un número) se pueden reemplazar con un valor (como 0) que facilitará el análisis numérico. Puede escanear y limpiar los datos ilógicos.

R

Dado que R fue creado por estadísticos para realizar análisis estadístico y numérico, la exploración de datos es un privilegio para aquellos que usan R. Puede realizar distribuciones de probabilidad, realizar pruebas estadísticas y crear modelos estándar de aprendizaje automático.
Las técnicas de optimización, el procesamiento estadístico, la generación de números aleatorios, el procesamiento de señales y el aprendizaje automático son algunas funcionalidades básicas de R.

Para modelado de datos

Pitón

Haga una pregunta y Python estará allí para ayudarlo. Análisis de modelado numérico? Ahí está Numpy.
¿Computación y cálculo científicos? SciPyi está ahí.
¿Y para los algoritmos de aprendizaje automático? Es un scikit-learn. Al usar scikit-learn, puede usar todos los paquetes de la biblioteca de aprendizaje automático contenidos en Python sin preocuparse por las complejidades internas.

R

Si desea realizar algún análisis de modelado en particular, debe salir de las funciones básicas de la biblioteca de R.
La distribución de Poisson y las mezclas de leyes de probabilidad son algunos de los paquetes de bibliotecas externas que se utilizan para algunos análisis de modelos de datos específicos.
Stack Overflow tráfico a preguntas sobre paquetes de Python seleccionados

Para visualización de datos

Pitón

Para la visualización de datos, podemos usar la distribución de Python: Anaconda.
Matplotlib se usa para crear gráficos y tablas usando los datos almacenados en Python y para los avanzados y un mejor diseño, se usa Plot.ly.
Es posible que haya visto tutoriales en línea sobre cómo aprender Python. La gente usa la función nbconvert para crearlo. Con esta función, puede convertir sus fragmentos de código en documentos HTML.

R

R contiene paquetes para técnicas de visualización científica que permiten que los resultados se muestren gráficamente.
Puede crear gráficos y diagramas elementales a partir de matrices de datos y guardarlos en formatos .jpg o PDF. Esto se puede hacer desde las bibliotecas R básicas.
Sin embargo, para trazados o gráficos avanzados, puede utilizar la función ggplot2.
Sombreado de colinas topográficas con Matplotlib
Puntos de correlación de Plot.ly del conjunto de datos Iris

Ventajas de usar R y Python en ciencia de datos y aprendizaje automático

  • El aprendizaje automático y la ciencia de datos son las dos áreas principales en las que el código abierto se ha convertido en el factor para desarrollar nuevas herramientas innovadoras.
  • La diferencia entre el aprendizaje automático y la ciencia de datos es un poco pegajosa, pero la idea principal es que el aprendizaje automático da prioridad a la precisión de la predicción en lugar de la interpretabilidad del modelo, mientras que la ciencia de datos se centra en la interpretabilidad y el razonamiento estadístico.
  • Python es mejor en precisión predictiva y se ha hecho famoso en el aprendizaje automático. Por otro lado, R se ha convertido en el campeón de la ciencia de datos debido a sus antecedentes estadísticos.
  • Sin embargo, ambos idiomas pueden realizar cualquier tarea de una manera bastante acomodada. Python tiene bibliotecas que se pueden utilizar como una herramienta de análisis de datos eficaz, mientras que R tiene paquetes para mejorar su flexibilidad en el análisis predictivo.
  • La consistencia es un factor que hace que R se quede atrás de Python. Dado que los algoritmos en R son proporcionados por terceros, la velocidad de desarrollo disminuye porque, para cada algoritmo, descubre nuevas formas de modelar datos.
  • Python es un lenguaje de programación de uso general con herramientas de aprendizaje automático y debido a paquetes similares a R, también se considera una herramienta de análisis de datos.
  • Tanto R como Python tienen excelentes paquetes para el análisis de datos y el aprendizaje automático. No puede equivocarse con ninguno de ellos, ya que hay muchas distribuciones, módulos y algoritmos para ambos.
  • Sin embargo, si está buscando un lenguaje de programación versátil y multipropósito, Python sería su mejor opción.

La popularidad de Python vs R

Tanto R como Python se han convertido en estrellas en el campo de la ciencia de datos y el aprendizaje automático.
R tuvo su popularidad en el año 2015 - 2016. Pero en los últimos años, Python se ha vuelto más popular.
La popularidad de Python se debe a sus paradigmas de programación múltiple, facilidad de lectura, disponibilidad de una amplia biblioteca y soporte de la comunidad. Mientras que otros lenguajes de programación como C, C ++ o Java necesitan alrededor de 5 a 7 líneas de código para imprimir "hola mundo", Python le ahorra tiempo y esfuerzo porque una sola línea de código es más que suficiente para ejecutarlo.
Algunos de los sectores en los que tanto R como Python han ganado popularidad en los últimos años son:
  • Análisis de los datos
  • Inteligencia artificial
  • Big Data
  • Redes
  • Telecomunicación
En el gráfico anterior, podemos ver que gradualmente otros sectores también están adaptando R y Python como preferencia. Organizaciones como empresas financieras, organizaciones minoristas, bancos e instituciones sanitarias han comenzado a ofrecer puestos de trabajo en R.

La tasa de crecimiento de R y Python

Pitón

Se considera que Python es el lenguaje de programación de más rápido crecimiento en el mundo. Según la encuesta de desarrolladores de Stack Overflow , en 2013, Python superó a R como el lenguaje más popular para la ciencia de datos.
Según Forbes, un científico de datos es el "trabajo más sexy del siglo XXI". Python está implementado en la vida real. Las operaciones básicas de ciencia de datos son más fáciles en Python en comparación con R. Además de su versatilidad y características más fáciles de codificar, los desarrolladores tienden a usarlo más.

R

En el año 2016, el 55% de los científicos de datos utilizó R, mientras que Python se situó en el 51%. En los siguientes 2 años, Python aumentó en un 33% y R se redujo en un 25%.
Entonces, la pregunta es, ¿continuará descendiendo la pendiente de R? Supongo que lo hará, pero no en la práctica.
R es el lenguaje del estadístico. Las personas que tienen como base las matemáticas y la estadística nunca descuidarán R al crear un modelo de ciencia de datos. R sería fácil y simple para ellos en lugar de Python.
Entonces, ¿cómo elegiremos?
Dado que la popularidad de R está descendiendo, usar R como complemento de Python será una buena combinación. De esta manera, R siempre tendría un papel que desempeñar en la caja de herramientas de un científico de datos.
A continuación se muestra el porcentaje de usuarios activos mensuales (MAU) de Python's Jupyter Notebook en la encuesta de Github de Ben Frederickson, que muestra un fuerte aumento después de 2015.
 "Clasificación de lenguajes de programación por usuarios de Github" - Ben Frederickson

Oportunidades profesionales

Pitón

Según IEEE, que rastrea los lenguajes de programación por su popularidad, Python se considera actualmente el lenguaje más popular para los científicos de datos en todo el mundo.
Algunas de las regiones en las que Python se usa ampliamente se mencionan a continuación:
Regiones en las que Python se usa ampliamente
Algunas de las organizaciones que utilizan el lenguaje Python:
  • NASA
  • Agencia Central de Inteligencia (CIA)
  • GOOGLE
  • SGI, Inc.
  • Nokia
  • IBM
Algunas de las organizaciones que usan lenguaje Python
Algunos de los perfiles de trabajo de Python con su paquete de salario básico:

según Payscale.com, a continuación se muestra un gráfico que muestra el salario promedio de Python para India y EE . UU .
También puede realizar la capacitación en Python para aprender los conceptos básicos del lenguaje de programación más popular y de más rápido crecimiento del mundo utilizado por científicos de datos, ingenieros de software e ingenieros de aprendizaje automático. Esta capacitación será una excelente introducción tanto a los conceptos fundamentales de programación como al lenguaje de programación y también mejorará sus habilidades.

R

El gráfico a continuación destaca los trabajos de los programadores de R del año 2009 a 2017.
Fuente: Stackoverflow
Algunas de las organizaciones que utilizan R como herramienta de análisis:
Algunas de las organizaciones que utilizan R como herramienta de análisis
  • Google
  • Facebook
  • Wipro
  • Los New York Times
  • Accenture
R puestos de trabajo con su paquete de salario básico:
  • Programador R - $ 77,7 22 por año.
  • Científico de datos: 123.000 dólares al año.
  • Analista de datos: $ 69,979 por año.
  • Arquitecto de datos: $ 112,764 por año.
  • Analista de visualización de datos: $ 84,809 por año.
  • Geoestadísticos -  $ 71,000 por año.

Pros y contras

Pitón

Pros:

1) Lenguaje todo en uno:  Python es un lenguaje de programación interpretado, interactivo, modular, dinámico, portátil, orientado a objetos y de alto nivel, que es accesible y fácil de aprender y tiene una curva de aprendizaje suave.
2) Un puñado de bibliotecas de soporte:  Python cuenta con una gran cantidad de bibliotecas estándar para operaciones de cadenas, interfaces del sistema operativo, manipulación de datos, recopilación de datos, aprendizaje automático, Internet, etc.
Scikit-learn y Pandas son dos herramientas para el análisis de datos y estructuras de alto rendimiento respectivamente. Si desea incluir funciones similares a R, tiene el paquete RPy2.
3) Integración: Python tiene mejores características de integración que R. Puede desarrollar servicios web mediante la integración con la integración de aplicaciones empresariales.
Aunque los desarrolladores prefieren lenguajes de bajo nivel como C, C ++ o Java, si Python se integra con ellos, se potencian las capacidades de control de Python.
4) Productividad: Python es extremadamente productivo para el programador y también en el área de desarrollo. Debido a su función de integración, marco y mayores capacidades de control, acelera el proceso de desarrollo.

Contras-

1) Dificultad para ir a otros idiomas:  si trabaja con Python durante un tiempo, le advertiría que no se enamora ciegamente. Declarar valores y variables sería una inseguridad a partir de entonces.
2) Computación débil en dispositivos móviles:  aunque Python se ha hecho un nombre en la mayoría de las plataformas de escritorio y servidores, la computación móvil sigue siendo un sueño.
3) Reducción de la velocidad: dado que Python se ejecuta utilizando un intérprete en lugar de un compilador, el tiempo necesario para la ejecución y compilación es un poco mayor de lo esperado.
4) Errores de tiempo de ejecución: el  tiempo de prueba, los errores de tiempo de ejecución y las restricciones de diseño son algunos de los problemas comunes desde que Python se escribió inicialmente de forma dinámica.

R

Pros—

1) Datos y visualización:  R sería su elección si el análisis de datos y la visualización de datos son prioridades para su proyecto.
2) Rico en bibliotecas y herramientas:  R tiene un rico ecosistema de bibliotecas estadísticas que lo convierte en una mejor herramienta para los cálculos estadísticos.
Caret es una biblioteca de aprendizaje automático que es capaz de crear modelos de predicción efectivos.
R contiene paquetes de análisis de datos avanzados que pueden controlar las fases de pre-modelado, modelado y post-modelado y también pueden realizar tareas particulares como visualización de datos y validación de modelos.
3) Buenas exploraciones: si tu trabajo se trata de modelos estadísticos y estás en la fase 1 de tu proyecto exploratorio, considera a R como ese amigo tuyo que explica conceptos de manera simple y breve justo antes del examen.

Contras-

1) Curva de aprendizaje pronunciada:  R es definitivamente un lenguaje de programación desafiante y pocos desarrolladores trabajan con él para construir proyectos.
2) Inconsistencia:  el ritmo de desarrollo de R se reduce debido a la inconsistencia del lenguaje porque la mayoría de los algoritmos en R son proporcionados por terceros.
Cada vez que tenga un nuevo algoritmo en la mano, debe aprender nuevas formas de modelarlo.

Conclusión y resumen

Aquí hay un breve resumen de todos los aspectos importantes de la comparación entre los dos lenguajes más importantes para la ciencia de datos y el aprendizaje automático: Python y R.
ParámetroRPitón
ObjetivoAnálisis de datos y cálculo estadísticoManipulación y minería de datos
Usuarios principalesAcadémicoIndustrias y Organizaciones
FlexibilidadBibliotecas fáciles de usar disponiblesFácil de construir nuevos modelos desde cero.
Curva de aprendizajeCurva de aprendizaje pronunciadaCurva de aprendizaje suave
Popularidad en cambio porcentual7,5% de disminución en 2018Incremento del 6,6% en 2018
Salario promedio127.949 dólares110.021 dólares
IntegraciónFunciona localmenteSe integra con C, C ++ o Java
Tamaño de la base de datosCapaz de manejar grandes tamaños de base de datosCapaz de manejar grandes tamaños de base de datos
Paquetes y biblioteca importantesDplyr, Ggplot2, Esquisse,
BioConductor, Brillante
Numpy, Pandas, Matplotlib, Scikit-learn, Scipy
Ventajas
  • Herramientas de análisis de datos
  • Bibliotecas de visualización de datos
  • Buenas técnicas de exploración
  • Legibilidad de código
  • Velocidad de desarrollo
  • Versatilidad
  • Característica de integración
  • Productividad
Desventajas
  • Curva de aprendizaje empinada
  • Inconsecuencia
  • Dependencias de la biblioteca
  • Débil en computación móvil
  • Errores en tiempo de ejecución
  • Reducción de velocidad
Después de comprender todo el escenario, podemos sacar la conclusión de que la decisión completa de si R es mejor que Python depende de nosotros. Es el requisito de los usuarios lo que hace que un lenguaje de programación como R y Python sea más popular que el otro. Es nuestra elección, en función de las características, seleccionar el lenguaje de programación para trabajar en ciencia de datos o aprendizaje automático o modelos predictivos o manipulación de datos, etc. Por otro lado, podría ser posible para un tercer idioma como una conjunción de R y Python. Hasta entonces, fusionemos nuestra creatividad y la máquina y desarrollemos modelos que casi podrían ser una mejora para la raza humana.
  • Pitón

Publicar un comentario

0 Comentarios