SWR-Radio (Codierte Weblinks entschlüsseln)

Antwort erstellen


Diese Frage dient dazu, das automatisierte Versenden von Formularen durch Spam-Bots zu verhindern.

BBCode ist eingeschaltet
[img] ist eingeschaltet
[url] ist eingeschaltet
Smileys sind ausgeschaltet

Die letzten Beiträge des Themas

Ich habe die Datenschutzerklärung gelesen und bin damit einverstanden.

   

Ansicht erweitern Die letzten Beiträge des Themas: SWR-Radio (Codierte Weblinks entschlüsseln)

von Jo » 04 Jan 2007, 19:20

Mit SWR1 gibt es Probleme. Zum einen werden die Sendungsinhalte meist sehr spät veröffentlicht, manchmal erst, wenn die Sendung schon läuft. Zum anderen war es zumindest vorhin zeitweise so, dass die Sendungsinformationen für morgen die gleichen waren wie die für heute.

Ich aktualisiere den Sender schon zweimal täglich (gegen 14:30 und 18:00), aber damit sind bei weitem nicht alle Sendungsinformationen zu bekommen. Noch öfter aktualisieren würde auch bedeuten, dass die TVB-Anwender ständig auf das Aktualisieren-Knöpfchen drücken müssten und sich dann trotzdem oft erst über die Sendung informieren könnten, wenn sie schon läuft. Es dauert ja auch eine Zeit vom Auslesen der Website bis zum Hochladen der Daten auf den TVB-Servern. Es gibt aber bei den Sendungsinformationen den Link zur Website. Da muss man eben im Browser solange auf aktualisieren drücken, bis die Infos vorhanden sind.

von Jo » 31 Dez 2006, 14:50

Es ist in Java. Aber ich glaube, drüberschauen hilft nicht viel. Hier sind ein paar Beispiele für Beschreibungsseiten:
1 2 3 4
Unterschiedliche Formatierungen und überwiegend ein Gewusel aus tables ohne richtige Markierungen, wo die Beschreibungen anfangen und aufhören.
Ich glaube, da bleibt mir nichts übrig als immer wieder die Daten ansehen und dort wo Fehler auftreten Stück für Stück nachbessern.
Bei SWR4 weiß ich vor allem nicht, wie ich mit den Lokalsendungen umgehe (Beispiel). Aber den Sender hat sich ohnehin niemand gewünscht, deshalb lasse ich das erstmal außen vor.

Für manche Tage sind die Daten auch unvollständig (Beispiel). Wenn was fehlt liegt das also nicht unbedingt am TV-Browser.

von Bananeweizen » 31 Dez 2006, 13:18

In welcher Sprache hast du deinen Parser erstellt? Wenn es irgendwas ist, was ich lesen kann, würde ich mal drüberschauen, ob ich dir weiterhelfen kann. So aus der Luft heraus liefe es ja sonst darauf hinaus, selbst einen Parser zu schreiben. Kannst also gerne mal die Quellen an mich schicken.

von Jo » 31 Dez 2006, 12:44

Der neue Parser ist soweit, dass die Sender SWR1, SWR2 und SWR cont.ra angeboten werden können. Die Struktur der Seiten mit den Sendungsbeschreibungen ist aber teilweise so unterschiedlich, dass nicht alles richtig angezeigt wird. Wo vorhanden ist aber ein Link zur Sendungsbeschreibung angegeben. SWR4 lässt sich mit dem Parser nicht richtig darstellen und Programminformationen für SWR3 werden in der Form ohnehin nicht angeboten.

von Jo » 21 Dez 2006, 19:35

SWR hat jetzt die Struktur ihrer Programmvorschau geändert, und zwar so, dass SWR2 das System von SWR1 und 4 übernommen hat, anstatt umgekehrt. Ich kann die Daten zwar noch über die "geheime" (= undokumentierte) URL http://www.swr.de/radiokalender/ abrufen, aber sie laufen zum Jahreswechsel aus. Es muss also ein neuer, deutlich aufwändigerer Parser geschrieben werden, die ausführlichen Sendungsbeschreibungen werden wahrscheinlich zumindest in einigen Fällen wegfallen.

von Jo » 02 Nov 2006, 19:35

bodo hat geschrieben:Wenn du die URL nicht auslesen kannst, kannst du aber immernoch "durchnavigieren", d.h. immer die Vater-Seite laden und darin dann die Links zu den Seiten rausfischen, oder?
Das ist mir zu aufwändig/fehlerträchtig. Ich müsste aus dem Kalendermenü die "Vater-Seite" rausfischen und dort wieder die eigentliche Programmseite. Und im Kalendermenü ist es z.B. so, dass die Links zu nächsten/letzten Monat nicht zum ersten/letzten Tag des Monats führen, sondern irgendwohin.
Solange ich weiß, dass der Sender die Daten auch anders anbietet (war z.B. bei "Deutsche Mailbox" so) möchte ich das gar nicht erst versuchen.

von bodo » 27 Okt 2006, 07:02

Wenn du die URL nicht auslesen kannst, kannst du aber immernoch "durchnavigieren", d.h. immer die Vater-Seite laden und darin dann die Links zu den Seiten rausfischen, oder?

von Jo » 26 Okt 2006, 22:41

Ich habe bisher vom Sender keine Antwort bekommen und glaube auch, dass es schwierig wird, da jemanden zu finden der sich auskennt.
Vielleicht packt ja noch jemand der Ehrgeiz da eine Zugriffsmöglichkeit zu bekommen. Die URLs sind ja nicht bewusst verschlüsselt, sondern es wird einfach die Software sein, die auf die Art eine eindeutige Bezeichnung erstellt. Ich möchte fast wetten, dass es noch eine andere Möglichkeit gibt. Gibt man z.B. http://www.swr.de/swr1/bw/tipps ein, kommt man automatisch zur Seite http://www.swr.de/swr1/bw/tipps/-/id=44 ... index.html . Ich habe aber bislang keine zufriedenstellende Möglichkeit für das Radioprogramm gefunden.
Wenn vom Sender keine Antwort kommt, werde ich (erstmal) nur SWR2 anbieten.

von Jo » 23 Okt 2006, 19:30

Mittlerweile habe ich herausgefunden, dass es bis vor knapp 2 Wochen eine Möglichkeit gab, dieses Problem zu umgehen. Das war wahrscheinlich das, was ich in Erinnerung hatte. Ich habe zwar noch eine andere Möglichkeit gefunden, da werden aber nur noch Uhrzeit und Sendungstitel angegeben. Dann muss ich wohl doch versuchen beim Sender Infos zu bekommen.

von fingerhut » 23 Okt 2006, 17:41

ich habe keine ahnung wie willst du die webseite auslesen?

habe mal so was mit vbs script gemacht siehe
http://wiki.tvbrowser.org/index.php/Cap ... bScheduler



und du müssest warscheinlich erst mal den nächsten tag auslesen


<td align="right" valign="top"><span class="programmrubrik"><a href="http://www.swr.de/swr4/rp/programm/-/id ... [b]1djkwva[/b]/index.html" target="_top" >[>]</a></span></td>

ändert sich auch immer

von Jo » 23 Okt 2006, 17:24

fingerhut hat geschrieben:die tv daten sind nur eingebunden siehe

http://www.swr.de/swr4/rp/programm/-/id ... index.html
Das meinte ich. Gibt es eine Möglichkeit, auf diesen Link von alleine zu kommen, ohne ihn aus den Webseiten zu ziehen? Bei SWR 2 gibt es "&mDay=24&mMonth=10&mYear=2006" in der URL für den 24.10.2006, beim obigen Link ist "did=449434/be5g5o/index.html" das Problem. Der Rest müsste durch Datum und Sender festgelegt sein.

von fingerhut » 23 Okt 2006, 17:19

SWR-Radio (Codierte Weblinks entschlüsseln)

von Jo » 23 Okt 2006, 16:59

Ich habe die Genehmigung die Radio-Programmdaten auf der SWR-Website zu nutzen. Allerdings haben die Links zu den Tagesdaten bei SWR 1 und 4 im Gegensatz zu SWR 2 eine Art Id (Beispiel, dort der iframe). Ich hatte vor einiger Zeit schon mal geplant, die Sender anzubieten, habe das u.a. deshalb gelassen. Dann habe ich vor kurzem auf die Seiten geguckt und konnte nicht mehr verstehen, was das Problem war, und jetzt sitze ich wieder davor und weiß nicht mehr, warum ich das letztens für unproblematisch hielt.
Ich könnte beim Sender nachfragen, aber ich vermute, dass es dauert bis sich dort jemand findet der sich damit auskennt. Vielleicht hat ja hier jemand eine Lösung. Die aber bitte besser nicht im Forum posten, sondern mir als Private Nachricht senden.

Nach oben