Four steps to master machine learning with python (including free books & resources)

To understand and apply machine learning techniques you have to learn Python or R. Both are programming languages similar to C, Java or PHP. However, since Python and R are much younger and “farer away” from the CPU, they are easier. The advantage of Python is that it can be adopted to many other problems than R, which is only used for handling data, analysing it with e.g. machine learning and statistic algorythms and ploting it in nice graphs. Because Python has a broader distribution (hosting websites with Jango, natural language proecssing, accessing APIs of websites such as Twitter, Linkedin etc.) and resembles more classical programming languages like C Python is more popular.

(more…)

Please follow and like us:

Scraping Links ohne/without Beautiful Soup

Scarping ist das englische Wort für kratzen (engl. to scrap) und meint das Suchen und Speichern von Text, Links, Bildern, Videos und Audios aus dem Netz. Es ist immer beliebter geworden, ein wichtiger Bestandteil von BigData und Analytics und hat durch die große Belastung auf den Servern, dazu geführt, dass diese Tätigkeit von vielen Websiten aktiv verhindert wird. Hier lernst Du wie Du Links scrapst ohne das Modul Beautiful Soup.

In diesem Beispiel möchte ich Links aus einer Website scrapen, die sich in einer Auflistung befinden. Wie z.B. diese List mit den Topten machinelearning Modulen in Python.

(more…)

Please follow and like us:

Seaborn – Datenvisualisierung in Python!

Schon immer neidisch auf das schönere Layout von R-Graphen gewesen? Python braucht sich nicht mehr vor R verstecken! Der Astrophysiker Jake VanderPlas stellt in diesem Post auf O’Reilly Seaborn vor, das einem eine schönere Visualisierung von Daten als Matplotlib ermöglicht. Hier lernst Du wie Du das mit Seaborn schöne Graphen erstellst und Dataanalytics betreibst. 
Matplotlib wurde 1999 zum ersten Mal vorgestellt und hat daher ein etwas altmodisches Layout. Zudem harmonisiert es nicht sehr gut mit neuen Datenverabeitungsmodulen in Python wie Pandas oder Numpy.

(more…)

Please follow and like us:

Projekte über maschinelles Lernen in Python

Artikel die Software, Produkte und Geschehnisse quantitativ vermessen, erfreuen sich großer Beliebtheit. Besonders maschinelles Lernen (engl. Machine Learning) sind aufgrund des BigData-Hypes sehr in Mode. Dieser Kurze Artikel fast einen Artikel über das maschinelle Lernen zusammen und zeigt einen möglichen Pythoncode, um dessen Ergebnis zu reproduzieren.

Der Artikel “Top 20 Python Machine Learning Open Source Projects” wurde auf kdnuggets.com gepostet und hat viel Tweets und Blogbeiträge erzeugt. Er besteht eigentlich nur aus einem Graph, der die “Commits” auf Github mit dem “Contributors” plottet.  Wie zu erwarten ist Scikit-Learn das am besten performende Modul in dieser Liste:

(more…)

Please follow and like us: