Autor Thema: Strukturierte Daten aus Online-PDF bekommen  (Gelesen 384 mal)

Offline Hauswart

  • Developer
  • Sr. Member
  • ****
  • Beiträge: 763
Strukturierte Daten aus Online-PDF bekommen
« am: 29 April 2016, 11:56:11 »
Hallo Zusammen,


ist es möglich aus einem immer gleich aufgebautem online verfügbarem PDF strukturierte Daten für FHEM zu erhalten? Um zum Beispiel aus diesem PDF (https://www.nab.ch/fileadmin/user_upload/Public/Inhalte/Maerkte/Notenkurse.pdf) mir täglich den Tageskurs auszulesen?


Gruss und danke
Derzeitiges Setup unter Anderem:
* HM-CFG-USB
* nanoCUL868 (SlowRF)
* MySensors
* SIGNALduino 433

Offline herrmannj

  • Global Moderator
  • Hero Member
  • ****
  • Beiträge: 4391
Antw:Strukturierte Daten aus Online-PDF bekommen
« Antwort #1 am: 29 April 2016, 12:10:40 »
Zitat
ist es möglich ...

kurz: ja.
Lang: Wenn Du so fragst übersteigt es vtml *Deine* individuellen Programmierkentnisse (denn das muss individuell programmiert werden.)

PDF ist eine *sehr* schlechte Wahl um Daten davon zu extrahieren und dann in fhem zu verwenden.

Such Dir eine andere Datenquelle (HTML, json und co) dann kannst Du das mit fhem Bordmitteln erledigen. Das einlesen von Daten aus HTMLSeiten ist vielfach im Forum behandelt. Bei Wechselkursen stehen Dir viele Quellen zur Verfügung

vg
joerg
smartVisu mit fronthem, einiges an HM, RFXTRX, Oregon, CUL, Homeeasy, ganz viele LED + Diverse

Offline Hauswart

  • Developer
  • Sr. Member
  • ****
  • Beiträge: 763
Antw:Strukturierte Daten aus Online-PDF bekommen
« Antwort #2 am: 29 April 2016, 12:15:56 »
Ich habe eventuell eine sogar einfache Möglichkeit gefunden. Das PDF herunterladen, in HTML umwandeln und dann mit HTTPMOD die Daten auslesen?

https://poppler.freedesktop.org/
https://wiki.ubuntuusers.de/poppler-utils/
http://linux.die.net/man/1/pdftohtml
Derzeitiges Setup unter Anderem:
* HM-CFG-USB
* nanoCUL868 (SlowRF)
* MySensors
* SIGNALduino 433

Offline herrmannj

  • Global Moderator
  • Hero Member
  • ****
  • Beiträge: 4391
Antw:Strukturierte Daten aus Online-PDF bekommen
« Antwort #3 am: 29 April 2016, 15:31:14 »
könnte gehen. Aber Achtung. Pdf sind manchmal innen furchtbar unstrukturiert. Was von außen wie ein zusammenhängender Abschnitt aussieht ist in der pdf manchmal total auseinandergerissen.

Zwischen geht und nightmaare ist da alles drin.

vg
joerg
smartVisu mit fronthem, einiges an HM, RFXTRX, Oregon, CUL, Homeeasy, ganz viele LED + Diverse

Offline guhu

  • Jr. Member
  • **
  • Beiträge: 93
    • Paul
Antw:Strukturierte Daten aus Online-PDF bekommen
« Antwort #4 am: 29 April 2016, 15:35:57 »
Wenn Du an Währungskursen interessiert bist, nimm besser Yahoo finance api, siehe bspw. hier http://brusdeylins.info/tips_and_tricks/yahoo-finance-api/
FHEM 5.7 auf Synology DS215j, HM-CFG-USB2 mit hmlan, HM-CC-RT-DN, HM-SEC-SC-2, nanoCUL,a-culfw,Brennenstuhl-Steckdosen,-FB
Module:ENIGMA2,SONOS,FRITZBOX,FB_CALLLIST,HEATING CONTROL,VCONTROL300

Offline Hauswart

  • Developer
  • Sr. Member
  • ****
  • Beiträge: 763
Antw:Strukturierte Daten aus Online-PDF bekommen
« Antwort #5 am: 17 November 2017, 10:34:05 »
Ich pushe das Thema nochmal, hatte das Thema lange Zeit nicht mehr verfolgt, aber es ist immer noch interessant. Kurse von anderen Seiten sind nicht das Problem, aber spezielle diese Bank würde mich interessieren. :)
Derzeitiges Setup unter Anderem:
* HM-CFG-USB
* nanoCUL868 (SlowRF)
* MySensors
* SIGNALduino 433

Offline marvin78

  • Hero Member
  • *****
  • Beiträge: 4680
Antw:Strukturierte Daten aus Online-PDF bekommen
« Antwort #6 am: 17 November 2017, 10:35:50 »
Und bist du das Thema angegangen oder wartest du auf jemanden, der das für dich macht?

Offline herrmannj

  • Global Moderator
  • Hero Member
  • ****
  • Beiträge: 4391
Antw:Strukturierte Daten aus Online-PDF bekommen
« Antwort #7 am: 17 November 2017, 11:33:21 »
:) ich habe die gleiche Frage gerade versucht bissiger zu formulieren. Bist mir zuvorgekommen. Egal ....

@Hauswart
ich push das auch mal. Gibt es was neues dazu ? ;)
smartVisu mit fronthem, einiges an HM, RFXTRX, Oregon, CUL, Homeeasy, ganz viele LED + Diverse