SWR-Radio (Codierte Weblinks entschlüsseln)

Hier wird dir geholfen, wenn du TV-Daten anbieten möchtest.
Antworten
Jo
Site Admin
Beiträge: 11815
Registriert: 07 Apr 2006, 23:39

SWR-Radio (Codierte Weblinks entschlüsseln)

Beitrag von Jo »

Ich habe die Genehmigung die Radio-Programmdaten auf der SWR-Website zu nutzen. Allerdings haben die Links zu den Tagesdaten bei SWR 1 und 4 im Gegensatz zu SWR 2 eine Art Id (Beispiel, dort der iframe). Ich hatte vor einiger Zeit schon mal geplant, die Sender anzubieten, habe das u.a. deshalb gelassen. Dann habe ich vor kurzem auf die Seiten geguckt und konnte nicht mehr verstehen, was das Problem war, und jetzt sitze ich wieder davor und weiß nicht mehr, warum ich das letztens für unproblematisch hielt.
Ich könnte beim Sender nachfragen, aber ich vermute, dass es dauert bis sich dort jemand findet der sich damit auskennt. Vielleicht hat ja hier jemand eine Lösung. Die aber bitte besser nicht im Forum posten, sondern mir als Private Nachricht senden.
Zuletzt geändert von Jo am 31 Dez 2006, 12:41, insgesamt 1-mal geändert.
Benutzeravatar
fingerhut
Platin Member
Beiträge: 2923
Registriert: 03 Feb 2005, 10:18
Wohnort: Nürnberg

Beitrag von fingerhut »

Zuletzt geändert von fingerhut am 23 Okt 2006, 17:34, insgesamt 2-mal geändert.
Jo
Site Admin
Beiträge: 11815
Registriert: 07 Apr 2006, 23:39

Beitrag von Jo »

fingerhut hat geschrieben:die tv daten sind nur eingebunden siehe

http://www.swr.de/swr4/rp/programm/-/id ... index.html
Das meinte ich. Gibt es eine Möglichkeit, auf diesen Link von alleine zu kommen, ohne ihn aus den Webseiten zu ziehen? Bei SWR 2 gibt es "&mDay=24&mMonth=10&mYear=2006" in der URL für den 24.10.2006, beim obigen Link ist "did=449434/be5g5o/index.html" das Problem. Der Rest müsste durch Datum und Sender festgelegt sein.
Benutzeravatar
fingerhut
Platin Member
Beiträge: 2923
Registriert: 03 Feb 2005, 10:18
Wohnort: Nürnberg

Beitrag von fingerhut »

ich habe keine ahnung wie willst du die webseite auslesen?

habe mal so was mit vbs script gemacht siehe
http://wiki.tvbrowser.org/index.php/Cap ... bScheduler



und du müssest warscheinlich erst mal den nächsten tag auslesen


<td align="right" valign="top"><span class="programmrubrik"><a href="http://www.swr.de/swr4/rp/programm/-/id ... [b]1djkwva[/b]/index.html" target="_top" >[>]</a></span></td>

ändert sich auch immer
Jo
Site Admin
Beiträge: 11815
Registriert: 07 Apr 2006, 23:39

Beitrag von Jo »

Mittlerweile habe ich herausgefunden, dass es bis vor knapp 2 Wochen eine Möglichkeit gab, dieses Problem zu umgehen. Das war wahrscheinlich das, was ich in Erinnerung hatte. Ich habe zwar noch eine andere Möglichkeit gefunden, da werden aber nur noch Uhrzeit und Sendungstitel angegeben. Dann muss ich wohl doch versuchen beim Sender Infos zu bekommen.
Jo
Site Admin
Beiträge: 11815
Registriert: 07 Apr 2006, 23:39

Beitrag von Jo »

Ich habe bisher vom Sender keine Antwort bekommen und glaube auch, dass es schwierig wird, da jemanden zu finden der sich auskennt.
Vielleicht packt ja noch jemand der Ehrgeiz da eine Zugriffsmöglichkeit zu bekommen. Die URLs sind ja nicht bewusst verschlüsselt, sondern es wird einfach die Software sein, die auf die Art eine eindeutige Bezeichnung erstellt. Ich möchte fast wetten, dass es noch eine andere Möglichkeit gibt. Gibt man z.B. http://www.swr.de/swr1/bw/tipps ein, kommt man automatisch zur Seite http://www.swr.de/swr1/bw/tipps/-/id=44 ... index.html . Ich habe aber bislang keine zufriedenstellende Möglichkeit für das Radioprogramm gefunden.
Wenn vom Sender keine Antwort kommt, werde ich (erstmal) nur SWR2 anbieten.
Benutzeravatar
bodo
Site Admin
Beiträge: 19635
Registriert: 03 Dez 2003, 19:37
Wohnort: Köln
Kontaktdaten:

Beitrag von bodo »

Wenn du die URL nicht auslesen kannst, kannst du aber immernoch "durchnavigieren", d.h. immer die Vater-Seite laden und darin dann die Links zu den Seiten rausfischen, oder?
Jo
Site Admin
Beiträge: 11815
Registriert: 07 Apr 2006, 23:39

Beitrag von Jo »

bodo hat geschrieben:Wenn du die URL nicht auslesen kannst, kannst du aber immernoch "durchnavigieren", d.h. immer die Vater-Seite laden und darin dann die Links zu den Seiten rausfischen, oder?
Das ist mir zu aufwändig/fehlerträchtig. Ich müsste aus dem Kalendermenü die "Vater-Seite" rausfischen und dort wieder die eigentliche Programmseite. Und im Kalendermenü ist es z.B. so, dass die Links zu nächsten/letzten Monat nicht zum ersten/letzten Tag des Monats führen, sondern irgendwohin.
Solange ich weiß, dass der Sender die Daten auch anders anbietet (war z.B. bei "Deutsche Mailbox" so) möchte ich das gar nicht erst versuchen.
Jo
Site Admin
Beiträge: 11815
Registriert: 07 Apr 2006, 23:39

Beitrag von Jo »

SWR hat jetzt die Struktur ihrer Programmvorschau geändert, und zwar so, dass SWR2 das System von SWR1 und 4 übernommen hat, anstatt umgekehrt. Ich kann die Daten zwar noch über die "geheime" (= undokumentierte) URL http://www.swr.de/radiokalender/ abrufen, aber sie laufen zum Jahreswechsel aus. Es muss also ein neuer, deutlich aufwändigerer Parser geschrieben werden, die ausführlichen Sendungsbeschreibungen werden wahrscheinlich zumindest in einigen Fällen wegfallen.
Jo
Site Admin
Beiträge: 11815
Registriert: 07 Apr 2006, 23:39

Beitrag von Jo »

Der neue Parser ist soweit, dass die Sender SWR1, SWR2 und SWR cont.ra angeboten werden können. Die Struktur der Seiten mit den Sendungsbeschreibungen ist aber teilweise so unterschiedlich, dass nicht alles richtig angezeigt wird. Wo vorhanden ist aber ein Link zur Sendungsbeschreibung angegeben. SWR4 lässt sich mit dem Parser nicht richtig darstellen und Programminformationen für SWR3 werden in der Form ohnehin nicht angeboten.
Bananeweizen
Site Admin
Beiträge: 3353
Registriert: 09 Sep 2006, 22:45

Beitrag von Bananeweizen »

In welcher Sprache hast du deinen Parser erstellt? Wenn es irgendwas ist, was ich lesen kann, würde ich mal drüberschauen, ob ich dir weiterhelfen kann. So aus der Luft heraus liefe es ja sonst darauf hinaus, selbst einen Parser zu schreiben. Kannst also gerne mal die Quellen an mich schicken.
Jo
Site Admin
Beiträge: 11815
Registriert: 07 Apr 2006, 23:39

Beitrag von Jo »

Es ist in Java. Aber ich glaube, drüberschauen hilft nicht viel. Hier sind ein paar Beispiele für Beschreibungsseiten:
1 2 3 4
Unterschiedliche Formatierungen und überwiegend ein Gewusel aus tables ohne richtige Markierungen, wo die Beschreibungen anfangen und aufhören.
Ich glaube, da bleibt mir nichts übrig als immer wieder die Daten ansehen und dort wo Fehler auftreten Stück für Stück nachbessern.
Bei SWR4 weiß ich vor allem nicht, wie ich mit den Lokalsendungen umgehe (Beispiel). Aber den Sender hat sich ohnehin niemand gewünscht, deshalb lasse ich das erstmal außen vor.

Für manche Tage sind die Daten auch unvollständig (Beispiel). Wenn was fehlt liegt das also nicht unbedingt am TV-Browser.
Jo
Site Admin
Beiträge: 11815
Registriert: 07 Apr 2006, 23:39

Beitrag von Jo »

Mit SWR1 gibt es Probleme. Zum einen werden die Sendungsinhalte meist sehr spät veröffentlicht, manchmal erst, wenn die Sendung schon läuft. Zum anderen war es zumindest vorhin zeitweise so, dass die Sendungsinformationen für morgen die gleichen waren wie die für heute.

Ich aktualisiere den Sender schon zweimal täglich (gegen 14:30 und 18:00), aber damit sind bei weitem nicht alle Sendungsinformationen zu bekommen. Noch öfter aktualisieren würde auch bedeuten, dass die TVB-Anwender ständig auf das Aktualisieren-Knöpfchen drücken müssten und sich dann trotzdem oft erst über die Sendung informieren könnten, wenn sie schon läuft. Es dauert ja auch eine Zeit vom Auslesen der Website bis zum Hochladen der Daten auf den TVB-Servern. Es gibt aber bei den Sendungsinformationen den Link zur Website. Da muss man eben im Browser solange auf aktualisieren drücken, bis die Infos vorhanden sind.
Antworten