Hauptmenü

Regex in html

Begonnen von Panik, 04 Dezember 2016, 09:27:18

Vorheriges Thema - Nächstes Thema

Panik

Hallo,

ich bräuchte mal Hilfe von den Regex-Gurus:

In einer Webseite taucht so ein Teil auf:

<tr class="all"><td>24</td><td align="left">"Soll"</td><td>1</td><td>4</td></tr>
<tr class="head0"><td>19</td><td align="left">"Ist"</td><td>1</td><td>1</td></tr>
<tr class="head1"><td>68</td><td align="left">"Hum"</td><td>1</td><td>2</td></tr>
<tr class="head2"><td>100</td><td align="left">"Bat"</td><td>1</td><td>3</td></tr>


Mein bisheriges Pattern:

(?<=<td[^>]*>).*?(?=<\/td>)


Mein Ziel wäre es, die Zeilen <tr...> zu matchen und dann die Werte zwischen allen <td...> in Groups zu bekommen:
Also so was wie:
Match[0]: <tr class="all"><td>24</td><td align="left">"Soll"</td><td>1</td><td>4</td></tr>
- Group[0]: 24
- Group[1]: Soll
- Group[2]: 1
- Group[3]: 4
usw.

Die Verschachtelung von TR und TD in einem Pattern - geht das?
Oder müßte ich da 2-stufig matchen?
Selbst wenn ich schon mal

<td>24</td><td align="left">"Soll"</td><td>1</td><td>4</td>

hätte, wie bekäme ich die Werte in oben aufgeführte Groupcollection?
Raspberry3+,  CUL USB V3 mit V 1.66 CUL868, TRXRFX433, HM-MOD-UART, Phoscon-GW