¿Qué lenguaje de programación debo aprender para convertirme en analista de datos?

Ya hay una buena variedad de respuestas a esto, pero 2 me destacan.

  1. SQL
  2. Pitón

SQL (¿Cómo obtengo mis datos?)

Si desea analizar datos, debe saber cómo describir los datos que se ajustan a CUALQUIER tipo de condiciones y cómo sacarlos de la base de datos. Sin duda, debe conocer SQL para hacerlo de manera eficiente y efectiva. Al aclara en otra respuesta que las bases de datos SQL no van a ninguna parte, y una GRAN cantidad de datos continuará almacenándose en ellas.

Python (¿Qué hago con mis datos?)

Ahora que puede describir sus datos utilizando SQL, ¿cómo hace realmente algo con ellos? ¿Cómo puede realizar algunos de los algoritmos de aprendizaje automático más comunes para sacar conclusiones de sus datos? La respuesta está en Python y más específicamente en la familia de bibliotecas SciKit-Learn. No puedo pensar en un lenguaje que le brinde un acceso más rápido a herramientas tan poderosas y que también sea relativamente fácil de aprender.

Hay 3 lenguajes de programación principales en los que debe centrarse:

  1. SQL: este es un lenguaje de base de datos que utilizará para extraer y manipular datos. SQL es el lenguaje de base de datos más utilizado y tiene muchas variaciones como PostgreSQL, MySQL e incluso Oracle. Si aprende los comandos principales, debe aprender cualquier marco fácilmente.
  2. Python: Python es un lenguaje de programación de uso general. Es muy fácil de aprender y comprender debido a su entorno amigable con la sintaxis. Si planea aprender Python, aquí hay algunas bibliotecas que querrá saber para facilitarle la vida: Numpy, Pandas y MatPlotLib.
  3. R – Muchas personas no mencionan R. Es un lenguaje de programación muy estadístico que se utiliza principalmente para la ciencia / análisis de datos. Este es un lenguaje más difícil de aprender que Python, pero definitivamente es algo que debe tener en su cinturón de herramientas si desea elevar su carrera como científico de datos.

Aquí hay una publicación de blog que detalla más sobre las 3 herramientas anteriores y otras cosas que debe saber si está buscando seguir una carrera en datos.

Básicamente, hay muchos lenguajes de programación disponibles actualmente en el análisis de datos, como Python.

Pero recomendaría encarecidamente el lenguaje de programación R

R es ahora un lenguaje de programación maduro para el análisis estadístico. Yo lo llamaría el corazón de la ciencia de datos. Tiene bastantes herramientas de análisis y bibliotecas que lo ayudan a trabajar contra casi cualquier tipo de datos.

Aquí hay un buen curso para ello:

https://www.coursera.org/learn/r

También hay una especialización completa en cursos para la ciencia de datos aquí:

https://www.coursera.org/special


Disfruta aprendiendo ^ _ ^

Para un rol de analista de datos, debe comenzar con SAS, SQL y Excel. Obtenga una certificación BASE SAS, ya que aumentará las posibilidades de su trabajo, ya que mostrará a los reclutadores su motivación para ingresar a Data Analytics.

Sin embargo, Excel se considera fácil de usar: la mayor parte del procesamiento de números se realiza en Excel. Por lo tanto, es extremadamente importante sentirse cómodo con Pivots, Charts.

Vaya a Analytics Leap (www.a-leap. Com) y encontrará una guía para principiantes que encontrará realmente útil.

Mejor,

UNA

Tengo que ir junto con Jimmy Shen. No importa lo que hagan, SQL será la base de datos principal durante mucho tiempo . Y la variante T-SQL es un lenguaje de programación de procedimientos (eche un vistazo a la Referencia del lenguaje SQL de la base de datos Oracle, e41084.pdf, y eso es solo una parte de lo que puede hacer).

En orden por grupo …


1. Excel (VLOOKUPS, INDEX / MATCH, Boolean, PivotCharts)

2. SQL


3. Una herramienta de BI: SSRS, Tableau, etc.


4. Python (numpy, pandas, scipy, matplotlib) o Java


5. R, SAS (software), SPSS (software), Weka (software) o alguna otra herramienta de estadísticas si no hiciste Python para el # 4.

R, Python o SAS BASE: dependiendo de con qué trabaje / me guste más.

Si no conoce ninguno de ellos, aprenda los tres, o al menos R y Python (porque son gratuitos), y luego haga su elección.

Si es su primer idioma, Excel, si 2º .. 4º, Python, si 5º ++, R.

SQL a menudo se pasa por alto, pero la mayoría de los datos del mundo residen en entornos que aprovechan los dialectos sql.

  • R
  • Pitón
  • Java / Scala

Scala, si quieres usar Spark. Python también tiene la API de Spark.

More Interesting

¿Por qué a menudo obtengo los números de lotería correctos pero los juego en el juego equivocado?

¿Cuál ha sido su experiencia de pasantía con Morgan Stanley (analista de verano)?

Cómo proceder desde aquí para alcanzar mi objetivo de convertirme en un programador de primera clase

¿Quién es el mejor asesor profesional?

¿Qué tan difícil es conseguir un trabajo en los Estados Unidos después de una maestría en el campo de la ingeniería informática?

¿Los empleados de TCS obtendrán una banda este año? Escuché que tenemos un aumento ya que el salario básico se multiplica en una calificación promedio. ¿Es esto cierto?

Cómo aprovechar al máximo su primer trabajo como ingeniero de software

¿Cuáles son los salarios promedio en grandes empresas como Google o Facebook para un graduado en informática?

¿Debería continuar yendo a mi universidad o debería dejar de ir y buscar un trabajo a tiempo completo?

He hecho PCM en el 12 ° estándar. Me gustan las matemáticas, pero odio la física y la química. ¿Qué transmisión es mejor para mí?

¿Debo seguir mi sueño de toda la vida o ir a la universidad?

¿Cómo uno puede convertirse en fotógrafo de vida salvaje?

¿Puedo ser un ingeniero de aprendizaje automático exitoso si amo las matemáticas pero no me gusta codificar tanto?

¿Son reconocidos los títulos universitarios australianos de 3 años en los Estados Unidos si soy un estudiante internacional?

Un consultor en Accenture está buscando una oportunidad para unirse a MBB. ¿Cuál tiene mejores oportunidades?