Cherchez dans nos forums :

La programmation Python et les IH

Développement d'outils d'analyse financière en Python : partage d'expériences et ressources

Cette discussion sur un forum d'investisseurs porte sur le développement d'outils d'analyse financière personnalisés en Python. Un membre, FrankChalmers, présente Prolix, son application d'analyse boursière intégrant des interfaces graphiques, des indicateurs techniques, et des fonctionnalités de suivi de portefeuille. La discussion se centre sur les méthodes de développement, les sources de données utilisées, et les défis liés à la collecte et au traitement de l'information financière.

Les participants partagent leurs expériences de développement en Python, mettant en avant des librairies comme Beautiful Soup pour le web scraping, Pandas et NumPy pour l'analyse de données, Matplotlib pour la visualisation graphique, et PostgreSQL pour la gestion de bases de données. Des débats concernant le choix entre frameworks (Tkinter, Django, Flask) et les problématiques liées aux dépendances logicielles et à la pérennité des sources de données sont également abordés. Le rendement des investissements et la gestion du risque sont des préoccupations récurrentes, notamment en ce qui concerne l'investissement à long terme face à la spéculation.

Plusieurs membres expriment leur intérêt pour l'intégration de données fondamentales et techniques, soulignant la difficulté de trouver des sources de données libres et fiables. Les discussions abordent les défis liés au web scraping, notamment la gestion des erreurs 429 (trop de requêtes) et la nécessité d'utiliser des techniques d'anonymisation. La question de l'utilisation de données en temps réel versus des données historiques est également débattue, avec une discussion sur la qualité et la fiabilité des données fournies par différentes sources (Yahoo Finance, Google Finance, Morningstar, IEX Cloud).

La discussion s'élargit sur l'utilisation d'algorithmes d'intelligence artificielle pour l'analyse et le backtesting de stratégies d'investissement, ainsi que sur la création d'applications web pour une meilleure accessibilité. Des questions sur les aspects légaux du web scraping massif sont soulevées. L'utilisation de librairies de backtesting existantes est suggérée afin d'éviter une redondance de travail et de profiter d'optimisations déjà réalisées.

Enfin, les participants partagent des liens vers des ressources utiles, dont des tutoriels, des cours en ligne et des bibliothèques Python (yfinance, pandas-datareader, Scrapy) pour faciliter le développement d'outils d'analyse financière.


#76 11/07/2021 23h03

Membre (2019)
Top 50 Année 2022
Top 50 Portefeuille
Réputation :   217  

Avec yfinance je récupère uniquement le cours de cloture, le min et le max 52s, la market cap.

Je n’ai pas constaté de bugs de cet ordre. Les données sont assez fiables hormis quelques cas particuliers où le ticker change (ex/ TTE) ou alors si il y a eu un split très récent .

Après il est vrai que je mets une tempo aléatoire avant chaque appel pour éviter un nombre de requêtes trop important dans un laps de temps restreint.

Mais oui votre démarche de multiplier les sources est bonne et je devrais en faire de même.

Hors ligne Hors ligne

 

#77 11/07/2021 23h33

Membre (2016)
Réputation :   28  

Je mets également des tempos aléatoires dans mes codes de scrapping. D’ailleurs, je télécharge les données au format HTML ou CSV, et je ne scrappe pas si le fichier existe déjà, pour ne pas répéter des actions en cas de plantage du script. Jusque là tout va bien.

Pour les infos que vous mentionnez, GoogleSheet et la fonction GOOGLEFINANCE pourrait faire l’affaire, non ?
https://support.google.com/docs/answer/3093281?hl=en

L’idée que j’avais à la base, suite à une lecture d’Andreas Clenow Stock on the move, était d’implémenter des indicateurs complexes, de type pente de régression exponentielle et faire du backtest ou suivi de portefeuille à tout moment sans trop se soucier de la récupération des données (à partir du moment où elles sont fiables..). J’en suis encore loin.

Hors ligne Hors ligne