Kursplan för läsåret 2010/2011
(Genererad 2010-06-28.)
WEBB-INTELLIGENS OCH INFORMATIONSSÖKNINGEITN01
Web Intelligence and Information Retrieval

Antal högskolepoäng: 7,5. Betygsskala: TH. Nivå: A (Avancerad nivå). Huvudområde: Teknik. Undervisningsspråk: Kursen kan komma att ges på engelska. Överlappar följande kurs/kurser: EIT031. Valfri för: C4, D4, D4ks. Kursansvarig: Anders Ardö, Anders.Ardo@eit.lth.se, Inst för elektro- och informationsteknik. Förkunskapskrav: EDA011/EDA016 Programmeringsteknik. Förutsatta förkunskaper: FMA420 Linjär Algebra. Prestationsbedömning: Tentamen samt godkända laborationer och inlämningsuppgifter. Hemsida: http://www.eit.lth.se/kurs/eitn01.

Syfte
Kursens syfte är att öka förståelsen för metoder för informationssökning (Information Retrieval), strukturering, och kunskapsextraktion (text mining) speciellt från Internet-baserade källor.

Mål

Kunskap och förståelse
För godkänd kurs skall studenten

på egen hand kunna:

Färdighet och förmåga
För godkänd kurs skall studenten

Värderingsförmåga och förhållningssätt
För godkänd kurs skall studenten

Innehåll
Informationssökning: Basala begrepp för sökning och rankning, vektormodeller, tf-idf baserad relevans. System för informationssökning.

Sökspråk: Olika sökspråk för sökning i strukturerade databaser presenteras.

Strukturerad information: Indexering, sökning och relevansrankning av sökresultat. Exemplifieras med hjälp av sökningar i strukturerade databaser (SRU/CQL).

"Feature extraction": Extrahera egenskaper för dokument.

Grundläggande metoder för kunskapsextraktion och klassificering (som neurala nätverk, Support Vector Machines m fl) gås igenom och experimenteras med. Utnyttja extraherade egenskaper för att implementera ämnes-klassifikation för textdokument.

Prestanda: Prestandamätetal som precision och "recall".

Litteratur
Baeza-Yates, R, Ribeiro-Neto, B: Modern Information Retrieval.
Addison-Wesley 1999. ISBN: 0-201-39829-X
Artiklar och document från Webben.
Kursnoter och laborationer.