Kunstig intelligens (MNFIT-272) - høst 2000. Forelesning 9 Emner: Tolkning av naturlig språk - Kontekst-frie gramatikker - Chomsky hierarkiet - Kontekst-sensitive.

Slides:



Advertisements
Liknende presentasjoner
@ TDT4120 Algoritmer og datastrukturer Trær og søking i dem, samt litt diverse emner Åsmund Eldhuset asmunde idi.ntnu.no.
Advertisements

Gjør rede for relevante språklæringsteorier
KUNNSKAPSBASERTE METODER - UTVIKLINGSTRENDER
Problemløsning Per Holth HiAk.
Intro Datalingvistikk i IT – språk, logikk, psykologi Jan Tore Lønning.
Maskin Læring Litt generelt Hva er maskin læring?
@ TDT4120 Algoritmer og datastrukturer Trær og søking i dem, samt litt diverse emner Åsmund Eldhuset asmunde idi.ntnu.no.
FORMATIV VURDERING.
OOSU PATTERNS (mønstre) Hva er et Pattern – opprinnelsen Mal for en Patternbeskrivelse Typer Pattern vi anvender innen systemutvikling Noen eksempler.
Elevers læring av sannsynlighet i et IKT-miljø
UTFORDRINGER I TVERRFAGLIGE ENDRINGSPROSESSER Dagny Stuedahl stipendiat InterMedia.
© 2010 KPMG AS, a Norwegian member firm of KPMG network of independent member firms affiliated with KPMG International, a Swiss cooperative. All rights.
Kvalitative og kvantitative metoder
Damasio om rasjonelle valg og somatiske markører
Jæger: Robuste og sikre systemer INF150 Programmering Kapittel 2: Problemløsning Kapittel 3.1 og 3.2.
Utvikling og utnyttelse av virksomheters kunnskap DND Meetup, 11. sept Frank Lillehagen.
1 Måling: Metoder Nivåer Validering Churchill kap. 9 Troye & Grønhaug kap. 5 Reve: Validitet i økonomisk administrativ forskning Litteratur:
Planning and controlling a project Content: Results from Reflection for action The project settings and objectives Project Management Project Planning.
Objektorientert utforming In 140 Sommerville kap. 12.
A PROJECT WEEK 45: INTRO+ RESEARCH AND PLANNING WEEK 46: RESEARCH AND WIKI WRITING WEEK 47: NO ENGLISH WEEK 48: FINISHING TOUCHES WEEK 49: ORAL PRESENTATIONS.
Johan From Professor Handelshøyskolen BI
Kunstig intelligens (MNFIT-272) - høst Forelesning 11 Emner: Forskningsmetodikk innen Kunstig intelligens - Revidert definisjon - AI som empirisk.
Modellering og diagrammer Jesper Tørresø DAB1 E september 2007.
Emner: Kunstig intelligens (IT-2702) Forelesning 11 •
INTERNASJONAL PRIVATRETT Lovvalg i kontrakt – uten partenes valg Professor dr. juris Giuditta Cordero Moss.
Aktør-nettverk  Kort intro  Marc Berg (1997): On Distribution, Drift and the Electronic Medical Record  Margunn Aanestad (2003): The Camera as an Actor.
Forelesning Diskursanalyse
Kunstig intelligens (MNFIT-272) - høst Forelesning 10 Emner: Maskinlæring – symbolorientert - intro til maskinlæring generelt - induktiv symbol-prosessering.
Geografiske informasjonssystemer (GIS) SGO1910 & SGO4930 Vår 2004 Foreleser: Karen O’Brien Seminarleder: Gunnar Berglund
Kunstig intelligens (IT-2702) - høst Forelesning 10 Emner: Maskinlæring – symbolorientert - Induktiv symbol-prosessering - Læring i versjonsrom Tolking.
Sikkerhetsmomenter Konfidensialitet Integritet Tilgjengelighet Autentisering Non-Repudiation (Uomtvistelig) Sporbarhet.
Linked Data 2: Hvordan KoG31 Uke 8, 2013.
Using the personalized system of instruction in an introductory programming course Hallgeir Nilsen Universitetet i Agder.
The Thompson Schools Improvement Project Process Improvement Training Slides (Current State Slides Only) October 2009.
Oslo ASAP Oslo Advanced Sectorisation and Automation Project ”Point Merge”
Primary French Presentation 10 Colours L.I. C’est de quelle couleur?
Lave oljepriser kan bremse utvinningen på norsk sokkel Thina Margrethe Saltvedt, Sjefanalytiker Makro/Olje (Ph. D.) Mars
MM A estre mbisiøs atematikkundervisning MAM Novemberkonferansen 2015.
Hvordan integrere utenlandske studenter? Ulike grupper: Utvekslingsstudenter (1 semester) Kvotestudenter (flerårige program) Individuelle studenter.
Privacy by Design: Forslag til metode for å bygge personvern inn i systemløsninger Dag Wiese Schartum.
Digital læring for publikum og bibliotekansatte
OM BRUK AV LÆRINGSUTBYTTEBESKRIVELSER
Digital bestillingsprosess for Armering, direkte fra modell
Title: «How to use different tools and/or machines in the workshop»
Hvordan lærer vi på bransjenivå? Hva gjør Norsk olje og gass?
Meta-analyser og systematiske oversikter
Finn en liten, middels og en stor kongle.
Kunstig intelligens (MNFIT-272) - høst 1999.
Hvordan ta ut læring etter granskede hendelser?
Endringer, læring og robusthet
2021.AI.
Dette er et eksempel på plassering av logoene.
UBOs frokostmøte 12. juni 2015 Are Gulbrandsen & Dan Michael O. Heggø
Økonomiske forutsetninger
CAMPAIGNING From vision to action.
Using nursery rhymes and songs
The Scoutmaster guides the boy in the spirit of another brother.
Welcome to an ALLIN (ALLEMED) workshop!
Are Paradigms Radial Categories
The Gains from International Trade
Skadedata og risikoanalyser
Fra idé til forskningsprosjekt Hilde Afdal & Odd Tore Kaufmann
Numeriska beräkningar i Naturvetenskap och Teknik
Hca revisjon & rådgivning
A review of exploration activity and results on the NCS
INF2820 Datalingvistikk – V2011
Semester survey 2018 Mariana Hatzianastasiou, Amit Chitra Knutepunktet
ALL vectors have two components (x and y)
How to evaluate effects of inspections on the quality of care?
Utskrift av presentasjonen:

Kunstig intelligens (MNFIT-272) - høst Forelesning 9 Emner: Tolkning av naturlig språk - Kontekst-frie gramatikker - Chomsky hierarkiet - Kontekst-sensitive gramatikker Maskinlæring - induktiv symbol-prosessering - similaritetsbasert - forklaringsbasert

Tolkning av naturlig språk (NL) Fonologistudie av lydene (fonemene) som bygger ord Morfologistudie av komponentene (morfemene) som bygger opp ord Syntaksstudie av kombinasjon av ord i gramatikalsk lovlige setninger Semantikkstudie av ords og setningers mening Pragmatikkstudie av språks bruk og effekter i praksis

Trinn i (datamaskin-basert) språktolkning Setningstruktur analyse (parsing) - syntaktisk struktur, genererer et ”parse-tree” Semantisk tolkning - ords og kombinerte ords mening, representert i en eller annen KR-formalisme Kontekstuell tolkning - utvidet semantisk tolkning, resonnering ved bruk av en kunnskapsbase av verdens/domene-kunnskap

Basis-begreper Gramatikk-regler S = NP VP NP = N NP = A N N = man N = dog A = a A = the Ikke-terminaler er lingvistiske termer (setning, verb, …) - f. eks. 3 øverste linjer over Terminaler er ord i språket - f. eks. 4 nederste linjer over

Parsing i transisjons-nett (Transition Networks) Gramatikk representeres som et sett av sammenkoblede tilstandsmaskiner Noder er tilstander, lenker er overganger (transisjoner) mellom tilstander Hvert nett (hver tilstandsmaskin) representerer en ikke-terminal Å tolke en setning eller del av en setning svarer til å erstatte en ikke-terminal med høyre-siden av den tilhørende gramatikk- regel (høyre-siden er mer spesifikk en venstre-siden)

Chomsky-hierarkiet Rekursivt tellbare språk - frie produksjons-regler Kontekst-sensitive språk - flere ikke-terminaler på venstre side (men færre enn på høyre siden) av gram.regel Kontekst-frie språk - transisjonsnett, sammenkoblede tilstandsmaskiner, kun én ikke-terminal på venstresiden av gram.regel Regulære språk - en enkelt tilstandsmaskin, ikke flere sammenkoblet

Kontekst-sensitive språk Ønskelig, men komplekse parsere ”Augmented Transitions Networks” (ATNs) gir kontekst- sensitive egenskaper ved en utvidelse av kontekst-frie gramatikk-regler Kombinerer syntaktisk og semantisk parsing Tillater ”procedural attachments” på lenkene i trans.nettet Prosedyrene kan utføre tester, tilordne verdier, konstruere deler av parse-tre, etc.

Makinlæringsmetoder i MNFIT 272 Similaritetsbaserte:Versjonsrom ID3 Forklaringsbaserte:Meta-Dendral EBL Analogibaserte:CBR Sub-symbolske:Nevrale nett Genetiske algoritmer Både analogibaserte og sub-symbolske er kombinerte problemløsnings- og maskinlærings-metoder !

Hva er læring? Any process by which a system improves performance (H. Simon) Making useful changes in our minds (M. Minsky) The organisation of experience (M. Scott) Constructing or modifying representations of what is being experienced (R. Michalski)

Hva er maskinlæring? Metoder og teknikker som gjør datasystemer istand til selv å oppdatere sin kunnskap og problemløsnings-evne

Hvorfor maskinlæring? Modellere menneskers læring Studere læring og intelligens som fenomen Automatisere utvikling av kunnskapsbaserte systemer det siste er mest vektlagt i dette kurset

Maskinlæringmetoder kan klassifiseres utifra flere perspektiver Grad av selvlæring - pugging (rote learning) - instruksjon - læring ved analogi - læring ved eksempler - læring ved oppdagelse Type anvendelse - begrepslæring - problemløsning - situasjonsforståelse - produsere forklaringer Grad av bakgrunnskunnskap - kunnskapsfattige metoder - kunnskapsrike metoder Representasjonsspråk - attributt-verdi vektor - beslutningstrær - regler - predikatlogiske uttrykk - semantiske nett, rammer Grad av selv-læring - autonom læring - veiledet læring - ikke-veiledet læring - lærlingteknikker Grad av inkrementalitet - alle eksempler samtidig - inkrementell læring - læring gjennom problemløsning

Maskinlæring - kort historikk Nevrale modeller, Rosenblatt’s PERCEPTRON, Selvorganiserende systemer, Adaptive systemer, Læring som mønstergjenkjenning, Parameterjustering Samuel’s Checkers Player Kunnskapsbaserte metoder, Winston’s Analgy system, Symbolske teknikker for eksempelbasert læring, Michalski’s AQ system, Mitchell’s Version Space metode, Quinland’s ID3 system, Discovery systemer, Langley’s BACON, Lenat’s AM. Kunnskapsrike metoder, Buchanan’s Meta-Dendral, læring ved instruksjon, Davis’ Teresias, Ny giv for nevrale modeller, Forklaringsbasert læring, læring under problemløsning, case-basert læring, integrerte læremetoder Kunstig liv, Statistiske metoder, Data mining, Induktiv logikk-programmering, Genetiske algoritmer, Reinforcement læring, Bayesianske nett

Eksempelbasert læring Induktiv læring: Instansbasert læring: (case-basert, memory-basert) eksempler hypoteser kandidater begrep eksempler eksempler instansrommet:begrepsrommet:

Induktive systemer i MNFIT 272: Similaritetsbaserte: Læring i Versjonsrom (VS metoden) - Inkrementell læring - Lærer kun konjunktive begreper - Lærer klassifikasjonsregel Læring av beslutningstrær (ID3 metoden) - Alle eksempler på en gang - Lærer konjunktive og disjunktive begreper - Lærer beslutningstre Forklaringsbaserte: EBL Meta-Dendral

Version Space The version space is the set of all generalizations which are consistent with all of the examples It is described by the S and G sets: S is a generalization which is consistent with the examples and no other consistent generalization is more specific than it G is a generalization which is consistent with the examples and no other consistent generalization is more general than it

Version Space G S consistent generalizations more general more specific + examples move S up - examples move G down

Generality Lattice - Example (blue circle)(red circle) (? circle)(red ?)(blue ?)(? square) (red square)(blue square) (? ?)

Versjonsrom-algoritmen S summerer info fra de positive exempler G summerer info fra de negative exempler Når S=G er begrepet lært - dvs. flere eksempler tilfører ikke noe nytt Ikke nødvendig å ta vare på enkelteksemplene

Versjonsrom-algoritmen er en prinsipielt sterk læringsalgoritme - garanterer konsistens - er inkrementell men har store begrensninger i representasjonens uttrykkskraft - dvs. i hva som kan læres - kun konjunktive uttrykk - over-ivrig generalisering (mister muligheter)

Decision Trees Data structure for clasifying objects Restricted to featural descriptions Allows for disjunction +- size - shape color red blue green +- circlebigsmallsquare ”something red and small or green and square-shaped”

Learning EXAMPLE Feature-names: (size color shape) (+ (big red circle)) (+ (small red square)) (- (medium red circle)) size small medium big + -+ The concept of a big or small, but not medium-sized, object

ID3’s information theoretic measure Picking the right feature for the root is crucial to building simple trees Choose feature which gives the most information regarding the class of an instance: I(C):Information content of tree for set of instances C P:Feature selected as splitting node E(P):Expected information needed to complete tree given splitting on P gain(P):Information gain from feature P, gain(P) = I(C) - E(P)

+ shape - color red blue green +- square triangle circle +

One way to treat missing data

Summary: Similarity-based Learning Empirical, data-intensive Requires many examples and counter-examples Knowledge poor Generates unjustified concept definitions

Summary: Explanation-based Learning Analytical Learns from 1 example Knowledge rich Generates justified concept definitions

Explanation-based Learning: Use exisiting domain knowledge to explain why an example is a member of a concept or why a plan works. Explanations determines relevant features Generalise the explanation made, to obtain a justified (explained) operational definition of the concept

Explanation-based Generalisation Problem Given Goal concept Training example Domain theory Operationality criterion Determine A generalisation of the training example which is an operational sufficient concept definition

EBL method: 1. Explain Use the domain theory to explain why the example is an example of the goal concept 2. Generalise Determine the most general condictions under whch the explanation holds, and generalise the explanation