Kursplan för läsåret 2008/2009
(Genererad 2008-07-17.)
WEBB-INTELLIGENS OCH INFORMATIONSSÖKNINGEITN01
Web Intelligence and Information Retrieval

Antal högskolepoäng: 7,5. Betygskala: TH. Nivå: A (Avancerad nivå). Undervisningsspråk: Kursen kan komma att ges på engelska. Överlappar följande kurs/kurser: EIT031. Valfri för: C4, D3. Kursansvarig: Anders Ardö, Anders.Ardo@eit.lth.se, Inst för elektro- och informationsteknik. Förkunskapskrav: EDA011 Programmeringsteknik eller EDA016 Programmering. Förutsatta förkunskaper: FMA420 Linjär Algebra. EDA132 Tillämpad artificiell intelligens (läses med fördel parallellt). Prestationsbedömning: Godkända laborationer och inlämningsuppgifter. Hemsida: http://www.eit.lth.se/kurs/eitn01.

Syfte
Kursens syfte är att öka förståelsen för metoder för informationssökning (Information Retrieval), strukturering, och kunskapsextraktion (text mining) speciellt från Internet-baserade källor.

Mål

Kunskap och förståelse
För godkänd kurs skall studenten

på egen hand kunna:

Färdighet och förmåga
För godkänd kurs skall studenten

Värderingsförmåga och förhållningssätt
För godkänd kurs skall studenten

Innehåll
Informationssökning: Basala begrepp för sökning och rankning, vektormodeller, tf-idf baserad relevans. System för informationssökning.

Sökspråk: Olika sökspråk för sökning i strukturerade databaser presenteras.

Strukturerad information: Indexering, sökning och relevansrankning av sökresultat. Exemplifieras med hjälp av sökningar i strukturerade databaser (SRU/CQL).

"Feature extraction": Extrahera egenskaper för dokument.

"Computational Intelligence": Grundläggande metoder för kunskapsextraktion och klassificering (som neurala nätverk, Support Vector Machines m fl) gås igenom och experimenteras med. Utnyttja extraherade egenskaper för att implementera ämnes-klassifikation för textdokument.

Prestanda: Prestandamätetal som precision och "recall".

Litteratur
Ricardo Baeza-Yates, Berthier Ribeiro-Neto: "Modern Information Retrieval", Addison-Wesley 1999, ISBN: 0-201-39829-X.
Artiklar och document från Webben.
Kursnoter och laborationer.