Karen Spärck Jones

Z WikiKnihovna
Karen Spärck Jones

Soubor:Karen Spärck Jones.jpg

 
Huddersfield
Datum a
místo úmrtí
4. dubna 2007
Willigham
  rakovina
  manžel Roger Needham
 
 
Vzdělání Girton College
Pracoviště Cambridge
  {{{oceneni}}}
Známý pro Annual Award, Award for research ACM SIGIR, Honorary ScD, Award of Merit, Lifetime Achievement Award, ACM – AAAI Allen Newell Award, ACM Athena Lecturer, BCS Lovelace Medal


Karen Spärck Jones (26. srpna 1935, Huddersfield - 4. dubna 2007, Willingham), britská informační vědkyně, která se specializovala na vyhledávání informací (IR) a zpracování přirozeného jazyka (NLP). Těmto dvěma oblastem se věnovala již od konce padesátých let. Většinu svého života učila a prováděla výzkumy např. na zpracování informací v počítačové laboratoři na půdě Cambridgské univerzity.

Život

Karen Spärck Jones se narodila v Huddersfieldu, hrabství Yorkshire, v Anglii. Její otec, Owen Jones, přednášel chemii na univerzitě a její matka byla Ida Spärck, Norka, která se přestěhovala do Británie během druhé světové války. Karen Spärck Jones absolvovala gymnázium a pak studovala historii na Girtonově univezitě od roku 1953 až do roku 1956. Po nějaký čas pracovala jako učitelka. Od roku 1974 začala pracovat v počítačové laboratoři v Cambridge a odtamtud odešla až v roce 2002. Dle slov jejích kolegů z počítačové laboratoře byla vždy plná energie, příjemná, velkorysá a vždy je neúnavně podporovala. V počítačové laboratoři pracovala ještě několik měsíců před svou smrtí. Krátce předtím mohla vidět, jak její životní dílo o zpracování přirozených jazyků a vyhledávání informací dochází ještě většího ocenění než kdykoliv předtím od významných vědeckých institucí v oblasti počítačové vědy po celém světě. Zemřela 4. dubna v roce 2007 na rakovinu, tři roky po svém manželovi Rogerovi Needhamovi.

Zaměstnání

1958 – 1968 Research worker, Cambridge Language Research Unit
1965 – 1968 Research Fellow, Newnham College, Cambridge
1968 – 1988 Research positions, Computer Laboratory, University of Cambridge,Royal Society Scientific Information Research Fellow, Senior Research Associate,GEC Research Fellow
1988 – 2002 University of Cambridge: Assistant Director of Research,Reader in Computers and Information,Professor of Computers and Information

Odborní činnosti

1983 – 1996 Member Alvey IKBS Committee, Alvey Natural Language Coordinator, Member IKBS Subcommittee of SERC/DTI IE ATP, Member, Foresight Panels
1977 – 1985 Executive Committee, Museum Documentation Association
1987 – 1998 Advisory Committee, British Library R&D Department
1987 – 1989, 1990 – 1994 Executive Committee, Association for Computational Linguistics
1994 – President, Association for Computational Linguistics
2004 – Member, UK Computing Research Committee
1999 – 2002 Member of Council, British Academy
2000 – 2002 Vice-President, British Academy
1975 – Editorial Boards of Journal of Documentation, Information, Processing and Management, User Modelling and User-Adapted, Interaction, Computational Linguistics, Artificial Intelligence
1978 – Programme Committees for Conferences including ACL Conferences, COLING, ACM/SIGIR, IJCAI, numerous workshops
1993 – Chair, Dagstuhl Seminar on Summarising Text
1993 – Programme Committee for DARPA/NIST Text Retrieval Conferences
2001 – Programme Committee for DARPA/NIST DUC (Summarising) Conferences
1999 – Joint Organiser, Royal Society/British Academy Discussion Meeting
1999 – Chair, Computer Laboratory Celebration EDSAC 99
2004 – Chair, British Academy Policy Review on e-Resources for Research
2005 – UKCRC Grand Challenges Steering Committee

Zajímavosti

Měla hodně zálib, ale její největší vášní spolu s manželem bylo plachtění.

Práce

Profesorka Karen Spärck Jones byla jedním z průkopníků ve vyhledávání informací (IR) a zpracovaná přirozeného jazyka (NLP). Tyto dvě disciplíny z ní udělaly během její kariéry uznávaného počítačového vědce. Svou vědeckou výzkumnou dráhu začala ve výzkumném jazykové ústavu v Cambridge. Zde zkoumala využití tezaurů na zpracování jazyka. V těchto oblastech pracovala již od konce padesátých let a významnou měrou přispěla k chápání informačních systémů.

V šedesátých letech začala pracovat na IR neboli vyhledávání informací. V roce 1972 publikovala článek v Journal of Documentation, kterým definovala pojem inverzní frekvence dokumentu (IDF). Představila měření převrácené četnosti slov, což je technika, která byla přijata jako standart v moderních systémech včetně webových vyhledávačů a používá se ve většině vyhledávačů dodnes. Tato technika umožnila lidem pracovat s počítačem pomocí obyčejného slova místo rovnic a kódů. Je to statistická metoda sloužící k vyhodnocování, jak je důležité dané slovo v řadě dokumentů a jaký význam má slovo pro jednotlivý dokument. Vyhledávače díky IDF řadí důležitost odkazů na dotaz uživatele. Ačkoliv v roce 1972 to byla jen teorie, v roce 1994 se z ní stala skutečnost v rukách Mikea Burrowse použitím na Alta Vista.

Následně spolupracovala s Stephenem Robertsonem na stanovení hodnoty měření relevance slov, což bylo klíčovým krokem ve vývoji velmi úspěšného pravděpodobnostního modelu získávání informací, který dále rozvíjela.

Později se věnovala zpracování přirozeného jazyka, kde provedla důležitou práci zejména k přístupu k databázím a heterogenních systémů informačních dotazů.

Nověji pracovala na vyhledávání dokumentů, včetně řečových aplikací, vyhledávání v databázích, modelování uživatele a agenta, sumarizování informací a hodnocení informačních a jazykových systémů.

Hrazené výzkumné projekty

1965 – 1969 Automatic classification for information retrieval (OSTI)
1974 – 1983 Projects on Information Retrieval, Test Collections (BLR&DD)
1979 – 1993 Projects on Natural Language Processing and Inference for Database Access, Integrated Inquiry, Automatic Summarising (SERC)
1990 – 1993 Automated Information Intermediary (ESRC/MRC/SERC)
1990 – 1992 Core Language and Reasoning Engine (SERC/DTI and collaborators)
1993 – 1996 Video Mail Retrieval, with Engineering Department, ORL (SERC/DTI)
1997 – 2000 Multimedia Document Retrieval, with Engineering (EPSRC)

Aktivity

Karen Spärck Jones byla členkou v British Academy a v letech 2000-2002 v ní vykonávala funkci viceprezidentky. Byla také členkou AAAI (American Association for Artificial Intelligence) a ECCAI (European Coordinating Committee for Artificial Intelligence). V roce 1994 působila jako prezidentka Association for Computational Linguistics promluvila na její první konferenci Grace Hopper. Byla členkou programového výboru DARPA/NIST konferencí textového vyhledávání (TREC) od roku 1994, a účastnila se ostatních programů hodnocení v USA, zejména konferencí porozumění dokumentům v automatickém shrnutí.

Pomohla založit the Intelligent Knowledge Based System - výzkumný prostor ve Velké Británii, v Alvey programu, který financoval stovky projektů a přinesl obrovskou podporu AI (Artificial inteligence - umělá inteligence) a jazykové práce ve Velké Británii v osmdesátých letech. Mnoho let učila na univerzitě v Cambridge obor počítačové řeči a zpracování jazyka. Zde také dohlížela na mnoho doktorandských prací z oblastí zpracování přirozeného jazyka a vyhledávání informací.

Byla velkým zastáncem časopisu Journal of Documentation, kde nejen publikovala své články, ale v letech 1975 – 1985 byla členem redakční rady a v letech 1977 – 1980 se stala šéfredaktorem.

Celý život bojovala za větší zastoupení žen ve výpočetní technice, jejím sloganem bylo - ve volném překladu: „Počítačová věda je příliš důležitá na to, aby byla ponechána pouze mužům“.

Význam pro informační vědu a knihovnictví

Zasloužila se o ohromný pokrok ve vyhledávání informací a snažila se vytvořit nejlepší pravděpodobnostní model na vyhledávání dokumentů, informací a jazyka. Jeden z jejích nejdůležitějších přínosů byl koncept TF/IDF - term frequency / inverse document frequency. TF/IDF je v dnešní době používán ve většině vyhledávačů. Tato metoda umožňuje lidem pracovat s počítači za použití běžných slov namísto rovnic nebo kódů. TF/IDF posuzuje význam dokumentu podle frekvence výskytu klíčových slov v porovnání s frekvencí těchto slov v širším souboru dokumentů.

Ocenění

Dosáhla nejprestižnějších ocenění za svou činnost jako výzkumnice ve svém oboru.

1983 – Annual Award, for research, Institute of Information Scientists
1988 – Award, for research, ACM SIGIR (now Salton Award)
1997 – Honorary ScD, City University
2002 – Award of Merit, American Society for Information Science and Technology
2004 – Lifetime Achievement Award, Association for Computational Linguistics
2006 – ACM – AAAI Allen Newell Award
2007 – ACM Athena Lecturer
2007 – BCS Lovelace Medal

Publikace

Karen Spärck Jones napsala 10 knih a 69 časopiseckých článků. Její publikace jsou hodně citované v literatuře, v současné době existuje více než 1500 citací v databázi Web of Science a přes 4500 citací v Google Scholar.Mnoho prací bylo vydáno v Journal of Documentation, dva z nich byly následně znovu otištěny v sérii článků „60 years of the best in information research“.

Doporučení četba

Použitá literatura

Externí zdroje