Presentasjon lastes. Vennligst vent

Presentasjon lastes. Vennligst vent

Semantic Overlay Networks for P2P Systems Øyvind Reinsberg.

Liknende presentasjoner


Presentasjon om: "Semantic Overlay Networks for P2P Systems Øyvind Reinsberg."— Utskrift av presentasjonen:

1 Semantic Overlay Networks for P2P Systems Øyvind Reinsberg

2 Introduksjon Mål er å koble noder i et P2P-nettverk sammen etter semantisk sammenheng, i stedet for tilfeldig Eks: Noder med mange Rock-filer, vil koble seg til andre noder med mange Rock-filer

3 Bakgrunn Spørringer i mange av dagens systemer skalerer dårlig. Hash-baserte systemer yter er bra, så lenge spørringer går kun på nøkkelen filen hashes på, men dårlig på f. Eks. Tekst-søk og serier.

4 Eksempel Rock SON Sub-kategorier som ”Soft rock”, ”Hard rock” Eksempel på Rock SON

5 Utfordringer Klassifisering Hva er rock? Grad av granularitet: Bare rock, eller soft, pop, og metall? Når skal en node bli med i et SON? Er det nok med bare en sang, eller må du ha flere hundre?

6 SON Fokuserer ikke på hvordan spørringer blir rutet innen nettverket. Ignorerer linker Forutsetter at spørringer er delvise, så spørringen inkluderer et minimum antall svar som må bli returnert

7 SON Oppbygging

8 Klassifiseringshierarkier Ønsker et lite antall nettverk, med mange hits. Nodene som får spørringen har mange treff Nodene som har få treff på denne spørringen, får ikke spørringen

9 Klassifiseringshierarkier Viktig med gode definisjoner: 1. Produserer bøtter med dokumenter som tilhører et lite antall noder 2. Noder har dokumenter i et lite antall bøtter 3. Lett å implementere klassifiseringsalgoritmer med få eller ingen feil

10 Ønsker å klassifisere noder i stedet for filer Plasserer en node i et SON, hvis den har et ”betydelig” antall dokumenter i kategorien Reduserer antallet noder i hvert SON Færre noder mottar spørringen Reduserer antallet SONs hver node er med i Færre tilkoblinger som må bli vedlikeholdt

11 Kategoriserer filer etter allmusic.com Stil har f. Eks. 26 kategorier, med 255 underkategorier Experiment med 1800 Napster noder på University of Washington i % av nodene er i 8 eller færre bøtter Antall bøtter nodene har filer til

12 Klassifisering av dokumenter Forutsetter filer på form: directory/author-song title.mp3 Forutsetter kun musikkfiler Kilder til feil: Feil format på filnavn Feilstaving på filnavn Databasen allmusic.com er ikke komplett 25% av alle filer ble klassifisert feil ved automatisk klassifisering Bare 4 % ved manuell

13 Evaluering av spørringer Valgte 50 forskjellige spørringer 78% ble klassifisert av stil

14 SON Memberships Velger lagdelt SONs basert på stil/understil Får mye mindre SONs Søker først på understil, men hvis ikke nok resultater blir funnet, søkes stil

15 Resultater Gnutella trengte 1731 meldinger Lagdelte SONs trengte bare 461 Ikke så stor forskjell på populære sanger


Laste ned ppt "Semantic Overlay Networks for P2P Systems Øyvind Reinsberg."

Liknende presentasjoner


Annonser fra Google