Designing a DHT for low latency and high through TDT2 – Avanserte distribuerte systemer 10.10.2005 Øystein Ellingbø.

Slides:



Advertisements
Liknende presentasjoner
2 Leseferdigheter og lesevaner
Advertisements

GoOnline publisering Hvordan komme i gang med GoOnline. Denne presentasjonen tar deg steg for steg gjennom oppsett av nettsted med bruk av GoOnline Proffesional.
BraWeb Bestilling.
Posisjon/Produkt Liste
Server  Server tjenester  Server hardware. Server tjenester  Fil/print  Database  Web  Applikasjon  Mail  Gruppevare  Terminalserver  På de.
Slik kommer du til «Personverninnstillinger»: Logg inn på Facebook.
Trådløs telefon 7921G (side 1 av 2)‏ Normalvisning Hvilestilling Normalvisning: •Telefonnummer til den som er logget på vises •Valget Fører til Tjenester/Menyvalg.
Bruke Gmail 3a Gmail er et e-postprogram.
Slik kommer du til «Personverninnstillinger»: Logg inn på Facebook.
Stock Optimiser Beslutningsstøtteverktøy for optimalt reservedelslager
Nyheter visma business
Gjenfinningssystemer og verktøy II
@ TDT4120 Algoritmer og datastrukturer Trær og søking i dem, samt litt diverse emner Åsmund Eldhuset asmunde idi.ntnu.no.
TDT4120 Algoritmer og datastrukturer Trær og søking i dem, samt litt diverse emner Kristian Veøy
Lagringsystemer Harddisker SCSI NAS SAN.
Kapittel 6 Data Backup Service. Tradisjonell arkitektur •Mange klienter •En server (evt. et cluster) •Klientene tar backup m jevne mellomrom •Inkrementell.
Datakom. Gruppeundervisning 21. november. Prøveeksamen •Gjennomgang onsdag 27. november.
Kontakter i Gmail •De første e-postadresser som elevene skal bruke på kurset, bør legges inn i kontaktlisten i Gmail før kurset starter. •Da slipper eleven.
Sende e-postmelding videre
Funksjon PLS program uavhengig IO Diagnose/Feilsøking
Intelle SMS Mobile Link
Intranettløsning for små og store organisasjoner.
Masterforedrag 2006 Mats Erik Smestad. Masteroppgave Use of Kernighan-Lin in an IDS.
Kryptografi og nettverkssikkerhet
Formelt brev sakprosa.
@ TDT4120 Algoritmer og datastrukturer Trær og søking i dem, samt litt diverse emner Åsmund Eldhuset asmunde idi.ntnu.no.
1 Byzantine angrep på trådløse ad hoc nettverk Tord Ingolf Reistad Stipendiat på Telematikk, NTNU Norsk kryptoseminar 2004 NTNU.
Øvingsforelesning 2 Trær og søking i dem, samt litt diverse emner Kristian Veøy
Lagringsystemer Harddisker SCSI NAS SAN.
Fasttelefon (1/2) Beskrivelse 1 Håndsettlampe Lyser ved anrop, eller ved ny talemelding 2 Telefonskjerm Viser følgende: tid og dato pålogget telefonnummer.
Opplæring: Digital Diktering
Nova introduksjon Uninett konferansen Workshop: IaaS et al.
Looking up data In P2P systems. Innhold Søkeproblemet Distribuerte Hash Tabeller Noen eksempel systemer: CAN Pastry Tapestry Chord (som vil bli sett nærmere.
3 Kommunikasjonsmodeller
INF 295 Algoritmer og datastrukturer Forelesning 1 - kapittel 1 Introduksjon Hans F. Nordhaug (Ola Bø) (Ketil Danielsen, 2007)
INF 295 Algoritmer og datastrukturer Forelesning 9a Søketrær Hans Fr. Nordhaug (Ola Bø)
INF 295 Forelesning 16 - kap 9 Minimalt spenntre og korteste vei i grafer Hans Fredrik Nordhaug (Ola Bø)
INF 295 Algoritmer og datastrukturer Forelesning 11 Når RAM ikke strekker til - B-trær og Utvidbar hashing Hans Fr. Nordhaug (Ola Bø)
INF 295 Algoritmer og datastrukturer Forelesning 9b Balanserte (binære) trær Hans Fr. Nordhaug.
INF 295 Algoritmer og datastrukturer Forelesning 10 Invarianter og Hashing Hans Fr. Nordhaug (Ola Bø)
Publisering på verdensveven Kursdag 3 VÅFF, våren 2002.
A randomized protocol for signing contracts (extended abstract) S.Even, O. Goldreich, A.Lempel.
Kapittel 4: Transportlaget
Kap 3: Anvendelser av Internett
ESøknad - Et webbasert system for elektronisk innlevering av søknader om forskningsmidler Kort presentasjon av systemet beregnet på prosjektledere/forskere.
Funksjoner og Innstillinger i
INF 4130 Eksamen 2008 Gjennomgang.
Jæger: Robuste og sikre systemer INF150 Programmering mandag 18.9 Lesing av data fra fil og skriving av data til fil. Side 411 – 4.. Kap 4.
Elektronisk meldingsutveksling
Elektronisk samhandling – et prosjekt i Bergen kommune
Mandag Excel.
Termbaser Lars Nygaard. Termbaser Database over begreper Innhold –Definisjoner –Oversettelser –Leksikalske relasjoner –Eksempler.
Endringer på Min Bedrift Endringer Listene: ”Nye oppdrag”, ”Besvarte oppdrag” og ”Vunnede oppdrag” legges direkte på forsiden til.
INF 295 forelesning 12 Repetisjon per 17. februar Hans F. Nordhaug (Ola Bø)
Freenet A Distributed Anonymous Information Storage and Retrieval System.
Security Considerations for Peer- to-Peer Distributed Hash Tables TDT2 – Avanserte Distribuerte Systemer Lars-Erik Bjørk.
Handling Churn in a DHT Andreas Wigmostad Bjerkhaug.
The Impact of DHT Routing Geometry on Resilience and Proximity TDT 2, Olav Engelsåstrø
Gnutella TDT2 Avanserte distribuerte systemer Odin Standal.
Sikre kanaler Fra kapittel 8.2. Introduksjon Å beskytte kommunikasjonen mellom to parter kalles å lage en sikker kanal. Dette beskytter mot:  Avlytting/oppsnapping.
Routing Indices For P2P Systems TDT2 – Avanserte Distribuerte Systemer Lars-Erik Bjørk.
Semantic Overlay Networks for P2P Systems Øyvind Reinsberg.
Protokoller Pensum: Olsen, kap. 5 og 6. Kommunikasjonsprotokoll Rutiner for å administrere og kontrollere oversending av data Telefonsamtale (”Hallo”,
Application-Layer Multicast  Unicast: En maskin sender meldinger adressert til kun en annen maskin  Multicast: En maskin sender meldinger adressert til.
Undervisningsopplegg laget av Johan Nygaard for Vitenfabrikken i Sandnes Induksjonsbevis.
Hvordan skrive ut og hente utskrifter med kortløsning
Lag flytskjema Oppgave
Registrere økter Driftslogg SjåførApp
Brukerveiledning for timeregistrering med DFØ-appen
Internett som elektronisk kommunikasjonsmiddel
Utskrift av presentasjonen:

Designing a DHT for low latency and high through TDT2 – Avanserte distribuerte systemer Øystein Ellingbø

Oversikt Teknisk bakgrunn  Chord, DHash++, Vivaldi Lav latency  Iterativ og rekursiv lookup, proximity neighbor selection, koding og replisering, integrasjon Høy throughput  TCP, STP Oppsummering

Chord Lookup protokol Alle noder har en finger- og etterfølgertabell O(logN) kjøretid

DHash++ Bruker SHA-1 hash funksjon Lagrer blokker (nøkkel/verdi) på forskjellige noder IDA koding Bruker Chord til å bestemme server Flytter blokker etter som noder kommer og går

Vivaldi System for å beregne syntetiske koordinater for å gjette latens mellom nodene Desentralisert system Piggy-backer på Chord og DHash++ meldinger

Lav latency - Iterativ lookup Sender melding til og får svar fra alle involverte noder Må vente på svar Detekterer nodefeil

Lav latency - Rekursiv lookup Forespørselen videresendes direkte Reduserer antall meldinger Detekterer ikke nodefeil

Lav latency - Iterativ vs rekursiv Rekursivt i gjennomsnitt 0.6 ganger iterativt DHash++ bruker rekursivt, men faller til bake på iterativt ved gjentatt feil

Lav latency - Proximity neighbor selection Velger nærliggende noder som innslag i fingertabellen for å redusere latens Sjekker X noder Velger node med lavest latency DHash++ bruker X=16

Lav latency - Koding og replisering Koding  Datablokker splittes i l fragmenter.  Bare m fragmenter trengs for å rekonstruere en blokk  Redundant lagring av data Replisering  Spesialtilfelle av koding: m = 1, l = antall replikater  Redundant informasjon spredd over færre noder Grad av redundans: r = l/m Sannsynlighet for at blokk p er tilgjengelig:

Lav latency - Koding og replisering Høy r gir større valgmulighet i hvor data hentes fra, men øker nettverksbehovet ved skriving Hva som lønner seg kommer an på belastningen på systemet:  Lese-intensivt vil ha lavere latency med replisering  Skrive-intensivt vil bruke mindre båndbredde med koding DHash++ bruker koding, med m=7 og l=14

Lav latency - Integrasjon De siste hoppen for å finne en nøkkels forgjenger er dyre. Men for å hente en blokk trenger vi bare m av l fragmenter! Lookup kan altså avsluttes så fort vi har en node som har m av nodene med fragmenter i sin etterfølgerliste Dette gir dessverre færre fragmenter å velge i, som øker latency ved henting

Lav latency - Integrasjon Antall etterfølgere man minimum ønsker: d (d >= m) Lav d : Raskere lookup men høyere latency ved henting Høy d : Tregere lookup men lavere latency ved hetning Optimalt: d = l

Høy throughput Ønsker  Rask sending og mottak av store mengder data  Parallell sending og mottak av data  Overflytskontroll  Detektering og retransmisjon ved pakketap

Høy throughput - TCP Standard protokoll – slipper å implementere selv Tar seg av overflyt, retransmisjon osv Tar tid å koble opp -> Noen få langlivete oppkoblinger (til alle i finger- og etterfølgertabellen) Krever rekursiv lookup OG henting av data Rekursiv henting medfører høyere latency

Høy throughput – Striped Transport Protocol (STP) Spesialisert protokol for DHT Data kan sendes direkte mellom noder (ikke rekursiv henting) Vindustørrelsen økes ved vellykkede RPC og minkes ved time-out Bruker Vivaldi (noe modifisert) for å bestemme time- out Ved time-out sender man til neste node på listen i stedet

Høy throughput – TCP vs STP Figur til venstre, throughput:  STP: Gjennomsnittlig 261 KB/s  TCP: Gjennomsnittlig 133 KB/s Figur til høyre, latency ved henting:  STP: Gjennomsnittlig 192 ms  TCP: Gjennomsnittlig 447 ms

Oppsummering Latency:  Rekursiv lookup -> Reduserer antall sendte pakker  Proximity neighbor selection -> Søker nærliggende noder  Koding -> Øker tilgjengeligheten av data  Integrasjon -> Reduserer antall hopp ved lookup  TOTALT: Reduksjon med en faktor opp mot 2 Throughput  STP -> Tilpasset DHash++. Direkte oppkobling mellom noder  TOTALT: Ytterligere reduksjon av latency i tillegg til at throughput økes med en faktor opp mot 2