Forum > Klientspråk > Generella frågor
Hej! Är någon bekant med sk "mashups"? Dvs att man samlar in data från olika källor och sammanställer dessa i ny form?
Skulle gärna vilja ha lite tips på vart jag ska börja?
En sajt listar information med formatering:
<b>Måndag</b><br>
Text-text-text..<br>
Text-text-text..<br>
<br>
<b>Tisdag</b><br>
Text-text-text..<br>
Text-text-text..<br>
<br>
<b>Onsdag</b><br>
Text-text-text..<br>
Text-text-text..<br>
<br>
Redigerad av trollemother
Anledning: La till lite
Det du talar om är scraping eller att indexera andras sidor (lite som sökmotorerna gör). Alla Siteägare blir inte alltid så nöjda om du "snor" information från deras sidor och visar den på din sida som om den vore din.
Mashups är snarare ett sätt att koppla ihop olika tjänster på nätet och skapa nya genom att kombinera tjänsterna.
här har du en bra övning . Skapa en vädersite :
Masha ihop google maps med ett väder-API . Hitta på lite olika saker weather.com har ett tror jag. Gör kartan klickbar för olika länder tex och koppla ihop detta med ett valuta-API så kan man få aktuella kurser för landet du klickat på. Sen är det bara att bygga på det med andra tjänster. googla på SOAP API:er. finns tusentals på nätet som man får använda.
http://www.blirdetsol.se/ är en riktigt häftig sida enligt mig som uttnytjar olika slags API:er för att presentera väder. Tänkte bara tipsa om det Kimpo skriver om att det går att göra fräcka saker med hjälp av API:er som finns på nätet.
Men det är kanske inte sånt här du är ute efter?
Kan säga direkt att ingen kommer ha några invändningar över informationen jag vill hämta.
Det är ungefär det där jag är ute efter, är dock inte alls insatt i varken API eller SOAP, men jag gav det en snabb googling och det såg intressant ut, ska läsa vidare när jag kommer hem i eftermiddag.
Min tanke är dock att det borde gå att göra en kod, som rippar källkoden från en sida och sedan filtrerar ut det jag vill ha till exempel att den hämtar informationen som finns mellan
<b>Måndag</b>[...]<b>Tisdag</b>
ScreenScraping känner du igen med AJAX också, använder i princip samma metoder att köra anrop och liknande metoder ( XMLHTTP)
responseText som du får med ditt objekt kör du bara regEx för att filtrera ut det du vill hämta.
Tanken är att göra något som liknar iGoogle fast där jag anpassar innehållet helt själv riktat mot mig själv (en personlig startsida, till att börja med). Har ingen plan på att utveckla någon kommersiell tjänst utan bara lära mig.
ScreenScraping känner du igen med AJAX också, använder i princip samma metoder att köra anrop och liknande metoder ( XMLHTTP)
responseText som du får med ditt objekt kör du bara regEx för att filtrera ut det du vill hämta.
Ok men fattar inte riktigt varför vill du scrapa nånting för en personlig startsida. tv-tablåer ? finns api:er .Hämta senaste nyheterna från RSS-flöden från olika nyhetsssiter? behövs ingen scraping för detta. alla stora sökmotorerna har widgets man kan koppla in.
Det jobbiga med scraping grejen är att om sitens struktur ändras måste du även börja anpassa om ditt regex. OCh jag kan tyvärr inte hålla med Voigtan angående att det är kul att jobba med regex hehe ;) men smaken är som baken :P
Det här är enligt mig en av de bästa startsidorna på nätet, använder den själv som startsida, du kan anpassa i princip allt på den http://www.superstart.se , Den i är princip helt uppbyggd med web services, widgets och rss-flöden.
Ok men fattar inte riktigt varför vill du scrapa nånting för en personlig startsida. tv-tablåer ? finns api:er .Hämta senaste nyheterna från RSS-flöden från olika nyhetsssiter? behövs ingen scraping för detta. alla stora sökmotorerna har widgets man kan koppla in.
Det jobbiga med scraping grejen är att om sitens struktur ändras måste du även börja anpassa om ditt regex. OCh jag kan tyvärr inte hålla med Voigtan angående att det är kul att jobba med regex hehe ;) men smaken är som baken :P
Det här är enligt mig en av de bästa startsidorna på nätet, använder den själv som startsida, du kan anpassa i princip allt på den http://www.superstart.se , Den i är princip helt uppbyggd med web services, widgets och rss-flöden.
Men det var scraping jag letade efter, eftersom det passade min beskrivning ganska precis.
Sen är som sagt inte huvudsyftet med detta att få ut särskillt mycket mer än kunskap :)
RSS är ett smidigt sätt att arbeta med data som är till för att dela, så det skall du inte ignorera
SOAP och klassisk ASP går, men det är ett rent helvete att jobba med, klassisk ASP var inte byggd för det.
RegEx, är fruktansvärt roligt, om man kan det och vet hur man arbeta med det. Och varför skulle det inte vara roligt, det är enkelt och unversellt sätt att arbeta för att hitta mönster.
RSS är ett smidigt sätt att arbeta med data som är till för att dela, så det skall du inte ignorera
SOAP och klassisk ASP går, men det är ett rent helvete att jobba med, klassisk ASP var inte byggd för det.
[
En liten subfråga till det - med PHP då?
Jag har aldrig jobbat med PHP så jag vet inte, jag har byggt ASP applikationer som kör mot SOAP anrop och det är något jag vill undvika för allt som är heligt.
Om PHP har det, förmodligen har dom det och om dom inte har det så finns det säkert ett ramverk som gör det betydligt enklare än vad det är med ASP.
Redigerad: Finns tydligen: http://se2.php.net/soap