regex101 findet 12 Treffer - HTTPMOD gibt nichts zurück

Begonnen von Marko1976, 26 März 2026, 23:31:08

Vorheriges Thema - Nächstes Thema

Marko1976

@passibe
Naja, ChatGPT hat die falschen Ergebnisse erwischt, aber grundsätzlich gute Arbeit mit der KI. Die Teamnamen und das Serien-Ergebniss habe ich bereits rausbekommen. Wo ich aktuell dran bin sind die Einzelergebnisse.

Die Einzelnen Serien setzen sich ja aus jeweils bis zu sieben Spielen zusammen.

Und was dort in der KI-Lösung noch fehlt - wonach du aber wahrscheinlich auch nciht gefragt hast - ist eine Aufsplittung nach Runde, also Finale, Halbfinale, Viertelfinale und 1. Play-Off-Runde.
Der Grund dafür ist wieder der Seitenaufbau, denn z.b. aktuell gibt es das Finale noch gar nicht auf der Seite und wird erst hinzugefügt wenn die entsprechenden Mannschaften feststehen. Das bedeutet aber leider, dass der Inhalt der jetzt im ersten Reading landet (zur Zeit Kölner Haie, weil 1. Halbfinalbegegnung) stände dann plötzlich im 3. gefundenen Reading, da im 1. und 2. die Gegner der Finalpartien stehen.

Zitat von: RalfRog am 02 April 2026, 22:27:10Das kann man doch ganz gut in dem Screenshot sehen was ich als Text eingegeben habe und was dann als "gefunden" markiert ist.
Nein kann man nicht, da man ja nicht weiß was darüber oder darunter außerhalb des Fensters noch steht. Doch es ist schon wie vermuten. Leider bewirkt auch das herauslöschen der Leerzeichen eine extreme Änderung der Regex - das hatte ich selbst schon mal ausprobiert und völlig andere Ergebnisse bzw. Regex bekommen als mit.
Zitat von: RalfRog am 02 April 2026, 22:27:10letzten Dezember:
Letzten Dezember ging es um etwas völlig anderes, bitte fang nicht wieder davon an um weitere Missverständnisse zu vermeiden. Das eine war die reguläre Tabelle der Hauptrunde, das aktuell sind die Playoffs. Andere Seite, anderer Aufbau und Struktur, andere Auswertungen notwendig.

RalfRog

#31
Zitat von: Marko1976 am 03 April 2026, 20:58:31Die Teamnamen und das Serien-Ergebniss habe ich bereits rausbekommen. Wo ich aktuell dran bin sind die Einzelergebnisse

Mit ein bischen spielen gehts wohl - allerdings ist nicht ganz klar zu welchen Readings du genau willst.

Auch hier für mich einfach der Versuch sich mit deinem Ansatz und Hilfe von regex101.com schrittweise zu nähern.
=> Livecode aus https://www.penny-del.org/spiele

Attributes
attr eis reading01Name name
attr eis reading01RegOpt g
attr eis reading01Regex <div class="col-5 text-center">\v +<div class="imgcontainer">\v +<img class="img-fluid poteamlogo" alt.*images.*" \/>\v.*\v +\b(.*)\v.*\v.*\v.*Serie
attr eis reading02Name standing
attr eis reading02RegOpt g
attr eis reading02Regex <h3>(.*)<\/h3>
attr eis reading03Name einzel
attr eis reading03RegOpt g
attr eis reading03Regex <div class="col text-center gameentry">\v.*teamshorts">(\w+:\w+).*\v.*\v +(\d:\d)\v

Readings
einzel-1 SWW:KEC                      2026-04-04 22:08:51
einzel-2 0:1                          2026-04-04 22:08:51
einzel-3 KEC:SWW                      2026-04-04 22:08:51
einzel-4 4:2                          2026-04-04 22:08:51
einzel-5 SWW:KEC                      2026-04-04 22:08:51
einzel-6 2:4                          2026-04-04 22:08:51
einzel-7 KEC:SWW                      2026-04-04 22:08:51
einzel-8 2:1                          2026-04-04 22:08:51
einzel-9 MAN:BHV                      2026-04-04 22:08:51
einzel-10 5:2                         2026-04-04 22:08:51
einzel-11 BHV:MAN                     2026-04-04 22:08:51
einzel-12 4:5                         2026-04-04 22:08:51
einzel-13 MAN:BHV                     2026-04-04 22:08:51
einzel-14 5:1                         2026-04-04 22:08:51
einzel-15 BHV:MAN                     2026-04-04 22:08:51
einzel-16 6:1                         2026-04-04 22:08:51
einzel-17 MAN:BHV                     2026-04-04 22:08:51
einzel-18 4:3                         2026-04-04 22:08:51
einzel-19 STR:EBB                     2026-04-04 22:08:51
einzel-20 5:1                         2026-04-04 22:08:51
einzel-21 EBB:STR                     2026-04-04 22:08:51
einzel-22 2:1                         2026-04-04 22:08:51
einzel-23 STR:EBB                     2026-04-04 22:08:51
einzel-24 2:4                         2026-04-04 22:08:51
einzel-25 EBB:S                       2026-04-04 22:08:51
einzel-26 2:1                         2026-04-04 22:08:51
einzel-27 STR:EBB                     2026-04-04 22:08:51
einzel-28 2:1                         2026-04-04 22:08:51
einzel-29 RBM:ING                     2026-04-04 22:08:51
einzel-30 5:6                         2026-04-04 22:08:51
einzel-31 ING:RBM                     2026-04-04 22:08:51
einzel-32 1:6                         2026-04-04 22:08:51
einzel-33 RBM:ING                     2026-04-04 22:08:51
einzel-34 5:2                         2026-04-04 22:08:51
einzel-35 ING:RBM                     2026-04-04 22:08:51
einzel-36 7:2                         2026-04-04 22:08:51
einzel-37 RBM:ING                     2026-04-04 22:08:51
einzel-38 6:3                         2026-04-04 22:08:51
einzel-39 BHV:NIT                     2026-04-04 22:08:51
einzel-40 4:0                         2026-04-04 22:08:51
einzel-41 NIT:BHV                     2026-04-04 22:08:51
einzel-42 2:3                         2026-04-04 22:08:51
einzel-43 WOB:SWW                     2026-04-04 22:08:51
einzel-44 3:1                         2026-04-04 22:08:51
einzel-45 SWW:WOB                     2026-04-04 22:08:51
einzel-46 5:1                         2026-04-04 22:08:51
einzel-47 WOB:SWW                     2026-04-04 22:08:51
einzel-48 2:3                         2026-04-04 22:08:51
name-1 Kölner Haie                    2026-04-04 22:08:51
name-2 Adler Mannheim                 2026-04-04 22:08:51
name-3 Kölner Haie                    2026-04-04 22:08:51
name-4 Adler Mannheim                 2026-04-04 22:08:51
name-5 Straubing Tigers               2026-04-04 22:08:51
name-6 EHC Red Bull München           2026-04-04 22:08:51
name-7 Pinguins Bremerhaven           2026-04-04 22:08:51
name-8 Grizzlys Wolfsburg             2026-04-04 22:08:51
standing-1 0:0                        2026-04-04 22:08:51
standing-2 0:0                        2026-04-04 22:08:51
standing-3 4:0                        2026-04-04 22:08:51
standing-4 4:1                        2026-04-04 22:08:51
standing-5 2:3                        2026-04-04 22:08:51
standing-6 3:2                        2026-04-04 22:08:51
standing-7 2:0                        2026-04-04 22:08:51
standing-8 1:2                        2026-04-04 22:08:51

Zitat von: Marko1976 am 03 April 2026, 20:58:31...wird erst hinzugefügt wenn die entsprechenden Mannschaften feststehen. Das bedeutet aber leider, dass der Inhalt der jetzt im ersten Reading landet (zur Zeit Kölner Haie, weil 1. Halbfinalbegegnung) stände dann plötzlich im 3. gefundenen Reading...
Die Frage ist dann doch schon ob das so Sinn macht, da die kleinste Änderung alles durcheinander bringt.

Hilfreich in dem Zusammenhang zum Erkennen der Struktur sind die Entwicklertools z.B. Firefox (F12) oder ganz gezielt per Rechtsklick "Untersuchen (Q)"


FHEM VM Debian13 (trixie) auf Proxmox VE9  (Futro S740) - nanoCUL, HM-MOD-RPI-PCB und MAX!Cube über LAN
HM- Fensterkontakte, UP-Schalter, Bewegungsmelder und ein Rauchmelder sowie Shelly 3EM, 1PM, PlugS und IT Schaltsteckdosen

Prof. Dr. Peter Henning

#32
Zitat von: Marko1976 am 03 April 2026, 20:58:31Leider bewirkt auch das herauslöschen der Leerzeichen eine extreme Änderung der Regex - das hatte ich selbst schon mal ausprobiert und völlig andere Ergebnisse bzw. Regex bekommen als mit.
Zitat von: RalfRog am 04 April 2026, 00:25:45Die Frage ist dann doch schon ob das so Sinn macht, da die kleinste Änderung alles durcheinander bringt.
Nein, eben nicht.

Der "Threat"-Ersteller kann es drehen und wenden wie er will, er kann auch noch so oft um Hilfe rufen und andere beleidigen:
Das ist kein Anwendungsfall für Reguläre Ausdrücke
Sondern der klassische Anwendungsfall für XPath.

LG

pah



betateilchen

Zitat4 April 2026, 03:45:50

@pah Lass Dir doch vom Thread-Ersteller keine schlaflosen Nächte machen...  8)
-----------------------
Formuliere die Aufgabe möglichst einfach und
setze die Lösung richtig um - dann wird es auch funktionieren.
-----------------------
Lesen gefährdet die Unwissenheit!

Prof. Dr. Peter Henning

#34
Zitat von: betateilchen am 04 April 2026, 09:06:35keine schlaflosen Nächte machen.
Normale Arbeitszeit. Keiner stört... ;D

Zitat von: Marko1976 am 26 März 2026, 23:31:08Nach wie vor liege ich mit Regex auf Kriegsfuss.
Zitat von: Marko1976 am 24 März 2026, 15:57:48Ist es in Deutschland mitlerweile Verpönt mal normale ganze Wörter zu benutzen? Das bringt mich genauso weit wie gar nichts zu sagen.
Eben. Darum sagt man auch "Regulärer Ausdruck", nicht "Regex".

LG

pah

betateilchen

Zitat von: Prof. Dr. Peter Henning am 04 April 2026, 09:51:10
Zitat von: Marko1976 am 24 März 2026, 15:57:48Ist es in Deutschland mitlerweile Verpönt mal normale ganze Wörter zu benutzen?

Darum sagt man auch "Regulärer Ausdruck"

Wobei "regulär" ja auch kein deutsches Wort ist, sondern vom lateinischen "regularis = einer Regel gemäß" kommt.

Vielleicht könnte man "regelgerechter Ausdruck" sagen?

*duck-und-weg*
-----------------------
Formuliere die Aufgabe möglichst einfach und
setze die Lösung richtig um - dann wird es auch funktionieren.
-----------------------
Lesen gefährdet die Unwissenheit!

passibe

Zitat von: Marko1976 am 03 April 2026, 20:58:31@passibe
Naja, ChatGPT hat die falschen Ergebnisse erwischt, aber grundsätzlich gute Arbeit mit der KI. Die Teamnamen und das Serien-Ergebniss habe ich bereits rausbekommen. Wo ich aktuell dran bin sind die Einzelergebnisse.
Ah, ok. Ja, dann würde ich wohl in der Tat jetzt eher den Fokus auf XPath setzen, siehe:
https://forum.fhem.de/index.php?topic=45176
unter "aus der Doku zu XPath:"

Marko1976

@RalfRog
Genau um die Ergebinsse geht es mir aktuell. Und eben um die Termine der noch nicht ausgespielten Einzelpartien. Eine Serie kann ja ab dem Viertelfinale bis zu 7 Spiele umfassen bis der sieger feststeht. Ich hänge mal einen Screenshot an und versuche zu kennzeichen was wie wo relevant ist. Alles Grüne habe ich bereits abgehakt, alles Rote fehlt mir noch und Gelb markiere ich die jeweiligen Gruppierungen für die Roten Elemente. Blau kennzeichnet eine Runde der Play-Offs bei der immer Zwei Mannschaften in mehreren Spielen aufeinander treffen. Ähnlich einem KO-System werden es dann immer weniger Mannschaften.
Du darfst diesen Dateianhang nicht ansehen.

Zitat von: RalfRog am 04 April 2026, 00:25:45Die Frage ist dann doch schon ob das so Sinn macht, da die kleinste Änderung alles durcheinander bringt.
Leider habe ich keinen Anbieter der Daten gefunden der schon vorab alles mit Platzhaltern anzeigt. Im Gegenteil, bei den anderen Anbietern ist es durch Slider oder Tabs noch weiter verschachtelt.
Für die Grün markierten Bereich habe ich in de rRegex jeweils einen Bereich angegeben und zb die Namen nach Runde (also Viertelfinale, Halbfinale etc.) in separate Readings schreiben lassen. Dadurch wird sichergestellt, dass die erste Mannschaft im Viertelfinale auch nach dem hinzufügen des Halbfinales im gleichen reading landet.

Wenn man mal die beiden Motzprobanden ignoriert die nur stänkern wollen und rein gar nichts zum Thema beitrage ohne sich zu wiederholen, ist das Thema eh praktisch durch, da die Playoffs sich ja schon ihrem Ende endgegen neigen und ich nicht unbedingt noch mehr arbeit investieren will. Speziell da nun wieder meine zwei Hater hier auftauchen die schon zum wiederholten Mal gemeldet und nun auch angezeigt wurden.

Danke jedenfalls für die, die wirklich helfen und was bewegen wollen.