Karen Spärck Jones

Z WikiKnihovna
Karen Spärck Jones

Karen spärck jones 2.jpg

 
Huddersfield
Datum a
místo úmrtí
4. dubna 2007
Willigham
  rakovina
  manžel Roger Needham
  -
  britské
Vzdělání Girton College
Pracoviště Cambridge
  Annual Award, Award for research ACM SIGIR, Honorary ScD, Award of Merit, Lifetime Achievement Award, ACM – AAAI Allen Newell Award, ACM Athena Lecturer, BCS Lovelace Medal
Známý pro IR, NLP

Karen Spärck Jones (26. srpna 1935, Huddersfield - 4. dubna 2007, Willingham), britská informační vědkyně, která se specializovala na vyhledávání informací (IR) a zpracování přirozeného jazyka (NLP). Těmto dvěma oblastem se věnovala již od konce padesátých let. [1]Většinu svého života učila a prováděla výzkumy např. na zpracování informací v počítačové laboratoři na půdě Cambridgské univerzity.

Život

Karen Spärck Jones se narodila v Huddersfieldu, hrabství Yorkshire, v Anglii. Její otec, Owen Jones, přednášel chemii na univerzitě a její matka byla Ida Spärck, Norka, která se přestěhovala do Británie během druhé světové války. Karen Spärck Jones absolvovala gymnázium a pak studovala historii na Girtonově univezitě od roku 1953 až do roku 1956. Po nějaký čas pracovala jako učitelka. Od roku 1974 začala pracovat v počítačové laboratoři v Cambridge a odtamtud odešla až v roce 2002. Dle slov jejích kolegů z počítačové laboratoře byla vždy plná energie, příjemná, velkorysá a vždy je neúnavně podporovala. V počítačové laboratoři pracovala ještě několik měsíců před svou smrtí.[2] Krátce předtím mohla vidět, jak její životní dílo o zpracování přirozených jazyků a vyhledávání informací dochází ještě většího ocenění než kdykoliv předtím od významných vědeckých institucí v oblasti počítačové vědy po celém světě.[3] Zemřela 4. dubna v roce 2007 na rakovinu, tři roky po svém manželovi Rogerovi Needhamovi.[4]

Zaměstnání

1958 – 1968 Research worker, Cambridge Language Research Unit
1965 – 1968 Research Fellow, Newnham College, Cambridge
1968 – 1988 Research positions, Computer Laboratory, University of Cambridge,Royal Society Scientific Information Research Fellow, Senior Research Associate,GEC Research Fellow
1988 – 2002 University of Cambridge: Assistant Director of Research,Reader in Computers and Information,Professor of Computers and Information[5]

Odborné činnosti

1983 – 1996 Member Alvey IKBS Committee, Alvey Natural Language Coordinator, Member IKBS Subcommittee of SERC/DTI IE ATP, Member, Foresight Panels
1977 – 1985 Executive Committee, Museum Documentation Association
1987 – 1998 Advisory Committee, British Library R&D Department
1987 – 1989, 1990 – 1994 Executive Committee, Association for Computational Linguistics
1994 – President, Association for Computational Linguistics
2004 – Member, UK Computing Research Committee
1999 – 2002 Member of Council, British Academy
2000 – 2002 Vice-President, British Academy
1975 – Editorial Boards of Journal of Documentation, Information, Processing and Management, User Modelling and User-Adapted, Interaction, Computational Linguistics, Artificial Intelligence
1978 – Programme Committees for Conferences including ACL Conferences, COLING, ACM/SIGIR, IJCAI, numerous workshops
1993 – Chair, Dagstuhl Seminar on Summarising Text
1993 – Programme Committee for DARPA/NIST Text Retrieval Conferences
2001 – Programme Committee for DARPA/NIST DUC (Summarising) Conferences
1999 – Joint Organiser, Royal Society/British Academy Discussion Meeting
1999 – Chair, Computer Laboratory Celebration EDSAC 99
2004 – Chair, British Academy Policy Review on e-Resources for Research
2005 – UKCRC Grand Challenges Steering Committee[6]

Zajímavosti

Měla hodně zálib, ale její největší vášní spolu s manželem bylo plachtění.

Práce

Profesorka Karen Spärck Jones byla jedním z průkopníků ve vyhledávání informací (IR) a zpracovaná přirozeného jazyka (NLP). Tyto dvě disciplíny z ní udělaly během její kariéry uznávaného počítačového vědce. Svou vědeckou výzkumnou dráhu začala ve výzkumném jazykové ústavu v Cambridge. Zde zkoumala využití tezaurů na zpracování jazyka. V těchto oblastech pracovala již od konce padesátých let a významnou měrou přispěla k chápání informačních systémů.

V šedesátých letech začala pracovat na IR neboli vyhledávání informací. V roce 1972 publikovala článek v Journal of Documentation, kterým definovala pojem inverzní frekvence dokumentu (IDF). Představila měření převrácené četnosti slov, což je technika, která byla přijata jako standard v moderních systémech včetně webových vyhledávačů a používá se ve většině vyhledávačů dodnes. Tato technika umožnila lidem pracovat s počítačem pomocí obyčejného slova místo rovnic a kódů. Je to statistická metoda sloužící k vyhodnocování, jak je důležité dané slovo v řadě dokumentů a jaký význam má slovo pro jednotlivý dokument. Vyhledávače díky IDF řadí důležitost odkazů na dotaz uživatele. Ačkoliv v roce 1972 to byla jen teorie, v roce 1994 se z ní stala skutečnost v rukách Mikea Burrowse použitím na Alta Vista.[7]

Následně spolupracovala s Stephenem Robertsonem na stanovení hodnoty měření relevance slov, což bylo klíčovým krokem ve vývoji velmi úspěšného pravděpodobnostního modelu získávání informací, který dále rozvíjela.

Později se věnovala zpracování přirozeného jazyka, kde provedla důležitou práci zejména k přístupu k databázím a heterogenních systémů informačních dotazů.

Nověji pracovala na vyhledávání dokumentů, včetně řečových aplikací, vyhledávání v databázích, modelování uživatele a agenta, sumarizování informací a hodnocení informačních systémů a jazykových systémů.[8]

Hrazené výzkumné projekty

1965 – 1969 Automatic classification for information retrieval (OSTI)
1974 – 1983 Projects on Information Retrieval, Test Collections (BLR&DD)
1979 – 1993 Projects on Natural Language Processing and Inference for Database Access, Integrated Inquiry, Automatic Summarising (SERC)
1990 – 1993 Automated Information Intermediary (ESRC/MRC/SERC)
1990 – 1992 Core Language and Reasoning Engine (SERC/DTI and collaborators)
1993 – 1996 Video Mail Retrieval, with Engineering Department, ORL (SERC/DTI)
1997 – 2000 Multimedia Document Retrieval, with Engineering (EPSRC)[9]

Přednášky na odborných konferencích

1986 Workshop on the Foundations of Artificial Intelligence, Las Cruces
1988 Annual Convention of the Computer Society of India, Madras
1988 Keynote Speaker, RIAO 88 Conference, Cambridge MA
1988 ACM SIGIR Annual International Conference, Grenoble
1989 British Library Annual Research Lecture
1992 Association for Computational Linguistics Annual Conference
1993 First German Information Retrieval Conference, Regensburg
1994 Grace Hopper Celebration of Women in Computing, Washington
1994 Presidential Address, Association for Computational Linguistics
1995 Symposium on Document Analysis and Information Retrieval, Las Vegas
1997 Latsis Symposium on Information and Communication, ETH Zurich
2002 Grace Hopper Lecture, University of Pennsylvania
2003 European Conference on Digital Libraries, Trondheim
2004 W.C. Williams Lecture, University of Sheffield
2004 Lazerow Lecture, University of California, Los Angeles
2004 Award Lecture, Association for Computational Linguistics
2005 Salton Lecture, Cornell University
2005 Second International Conference on Language Processing, S Korea[10]

Aktivity

Karen Spärck Jones byla členkou v British Academy a v letech 2000-2002 v ní vykonávala funkci viceprezidentky. Byla také členkou AAAI (American Association for Artificial Intelligence) a ECCAI (European Coordinating Committee for Artificial Intelligence). V roce 1994 působila jako prezidentka Association for Computational Linguistics a promluvila na její první konferenci Grace Hopper.[11] Byla členkou programového výboru DARPA/NIST konferencí textového vyhledávání (TREC) od roku 1994, a účastnila se ostatních programů hodnocení v USA, zejména konferencí porozumění dokumentům v automatickém shrnutí.

Pomohla založit the Intelligent Knowledge Based System - výzkumný prostor ve Velké Británii, v Alvey programu, který financoval stovky projektů a přinesl obrovskou podporu AI (Artificial inteligence - umělá inteligence) a jazykové práce ve Velké Británii v osmdesátých letech. Mnoho let učila na univerzitě v Cambridge obor počítačové řeči a zpracování jazyka. Zde také dohlížela na mnoho doktorandských prací z oblastí zpracování přirozeného jazyka a vyhledávání informací.

Byla velkým zastáncem časopisu Journal of Documentation, kde nejen publikovala své články, ale v letech 1975 – 1985 byla členem redakční rady a v letech 1977 – 1980 se stala šéfredaktorem.

Celý život bojovala za větší zastoupení žen ve výpočetní technice, jejím sloganem bylo - ve volném překladu: „Počítačová věda je příliš důležitá na to, aby byla ponechána pouze mužům“.[12]

Význam pro informační vědu a knihovnictví

Zasloužila se o ohromný pokrok ve vyhledávání informací a snažila se vytvořit nejlepší pravděpodobnostní model na vyhledávání dokumentů, informací a jazyka. Jeden z jejích nejdůležitějších přínosů byl koncept TF/IDF - term frequency / inverse document frequency. TF/IDF je v dnešní době používán ve většině vyhledávačů. Tato metoda umožňuje lidem pracovat s počítači za použití běžných slov namísto rovnic nebo kódů. TF/IDF posuzuje význam dokumentu podle frekvence výskytu klíčových slov v porovnání s frekvencí těchto slov v širším souboru dokumentů.[13]

Ocenění

Dosáhla nejprestižnějších ocenění za svou činnost jako výzkumnice ve svém oboru.

1983 – Annual Award, for research, Institute of Information Scientists
1988 – Award, for research, ACM SIGIR (now Salton Award)
1997 – Honorary ScD, City University
2002 – Award of Merit, American Society for Information Science and Technology
2004 – Lifetime Achievement Award, Association for Computational Linguistics
2006 – ACM – AAAI Allen Newell Award
2007 – ACM Athena Lecturer
2007 – BCS Lovelace Medal[14]

Publikace

Karen Spärck Jones napsala 9 knih a velmi mnoho časopiseckých článků. Její publikace jsou hodně citované v literatuře, v současné době existuje více než 1500 citací v databázi Web of Science a přes 4500 citací v Google Scholar.Mnoho prací bylo vydáno v Journal of Documentation, dva z nich byly následně znovu otištěny v sérii článků „60 years of the best in information research“.

Monografie

SPÄRCK JONES, Karen a Ann COPESTAKE, Stephen ROBERTSON. Selected Papers of Karen Sparck Jones. Center for the Study of Language and Information, 2008, 350 Pages. ISBN 1575865696.

SPÄRCK JONES, Karen and Yorick WILKS. Automatic Keyword Classification for Information Retrieval. Archen Books, 2007. ISBN 020801201X.

SPÄRCK JONES, Karen and A. J. HERBERT, Robert NEEDHAM. Computer Systems: Theory, Technology and Applications. Springer, 2004, 355 pages. ISBN 038720170X.

SPÄRCK JONES, Karen and Peter WILLETT. Readings in Information Retrievel. San Francisco: Morgan Kaufmann Publishers, 1997, 587 pages. ISBN 1558604545.

SPÄRCK JONES, Kare nand Julia Rose GALLIERS. Evaluating Natural Language Processing Systems: An Analysis and Review. 1996, 243 pages. ISBN 3540613099.

SPÄRCK JONES, Karen and Peter WILLETT. Synonymy and Semantic Classification. Edinburgh: Edinnburgh University Press, 1987. ISBN 0852245173.

SPÄRCK JONES, Karen. Automatic Natural Langure Parsing. Ellis Horwood, 1983, 208 pages. ISBN 0853126216.

SPÄRCK JONES, Karen. Information Retrievel Experiment. Butterworth-Heinemann, 1982, 352 pages. ISBN 0408106484.

SPÄRCK JONES, Karen and Martin KAY. Linguistics and Information Science. Academic Press, 1974, 244 pages. ISBN 0126562504.

Články

Karen Spärck JONES. Some points in a time. Computational Linguistics, 31, 2005, 1-14.

Karen Spärck JONES. What's new about the Semantic Web? Some questions. ACM SIGIR Forum, 38 (2), December 2004, 18-23.

Karen Spärck JONES. Collective intelligence: it's all in the numbers. IEEE Intelligent Systems, 21 (3), 2006, 64-65.

Karen Spärck JONES. What's the value of TREC - is there a gap to jump or a chasm to bridge? ACM SIGIR Forum, 40 (1), 2006, 10-20.

Karen Spärck JONES. Automatic language and information processing: rethinking evaluation. Natural Language Engineering, 7, 2001, 1-18.

Karen Spärck JONES. Information retrieval and artificial inteligence. Artificial Intelligence, 114 (1-2), 1999, 257-281.

Karen Spärck JONES. Further reflections on TREC. Information Processing and Management, 36, 2000, 37-85.

Karen Spärck JONES. The way forward in information retrieval. Elsnews 6.3, 1997, 12-13.

Karen Spärck JONES. Summarising as a lever for studying large-scale discourse structure. ACL Workshop on Intentionality and Structure in Discourse Relations, 1993, 125-127.

Karen Spärck JONES. The role of artificial intelligence in information retrieval. Journal of the American Society for Information Science, 42, 1991, 558-565.

Karen Spärck JONES. Notes and references on early classification work. ACM SIGIR Forum, 25(1), 1991, 10-17.

Karen Spärck JONES. User models, discourse models, and some others. Computational Linguistics, 14 (3), 1988, 98-100.

Karen Spärck JONES. User models and expert systems. Computer Laboratory, University of Cambridge, 1984.

Karen Spärck JONES. UK initiatives on intelligent knowledge based systems. AISB Quarterly, No. 45, 1982, 23-25.

Karen Spärck JONES. Statistically-based document indexing. Skrifter om Anvendt og Matematisk Lingvistik, 6, 1980, 79-93.

Karen Spärck JONES. Performance averaging for recall and precision. Journal of Informatics, 2, 1978, 95-105.

Karen Spärck JONES. Intelligent automatic information retrieval. Journal of Informatics, 3, 1979, 75-88.

Karen Spärck JONES. Automatic indexing 1974: a state of the art review. Computer Laboratory, University of Cambridge, 1974 (OSTI Report 5193).

Karen Spärck JONES. A performance yardstick for test collections. Journal of Documentation, 31, 1975, 266-272.

Karen Spärck JONES. Automatic thesaurus construction and the relation of a thesaurus to indexing terms. Aslib Proceedings, 22, 1970, 26-28.

Karen Spärck JONES. Experiments in semantic classification. Mechanical Translation, 8, 1965, 97-112.

Karen Spärck JONES. Semantic classes and semantic message forms. Proceedings of the Conference on Computer-related Semantic Analysis,1965, X1-X17.

Karen Spärck JONES.Semantic markers. Cambridge Language Research Unit, 181, 1965.

Karen Spärck JONES. Current work on automatic classification for information retrieval. T.A. Informations, No. 2, 1967, 92-96.

Doporučení četba

Její disertační práce je povážována za velmi pokrokovou. Psala ji na téma “Synonymie a schématické klasifikace”. Práce je výjimečná ve zkoumání statistických, kombinovaných technik a symbolické technice v NLP.

Použitá literatura

  1. Computer Laboratory, University of Cambridge. [online]. 2011. [cit. 2012-05-09]. Karen Spärck Jones, FBA Professor Emerita of Computers and Information Honorary Fellow of Wolfson College 26 August 1935 – 4 April 2007. Dostupné z: http://www.cl.cam.ac.uk/misc/obituaries/sparck-jones/
  2. Wikipedia, The free Encyklopedia. [online]. 2012. [cit. 2012-05-09]. Karen Spärck Jones. Dostupné z:http://en.wikipedia.org/wiki/Karen_Sp%C3%A4rck_Jones
  3. Ieee Spectrum Inside Technology. [online]. 2007. [cit. 2012-05-09]. Computer Science, A Woman's Work Dostupné z: http://spectrum.ieee.org/geek-life/profiles/computer-science-a-womans-work
  4. Computer Laboratory, University of Cambridge. [online]. 2011. [cit. 2012-05-09]. Obituries. Dostupné z: http://www.cl.cam.ac.uk/misc/obituaries/sparck-jones/cv.html
  5. Computer Laboratory, University of Cambridge. [online]. 2011. [cit. 2012-05-09]. Obituries. Dostupné z: http://www.cl.cam.ac.uk/misc/obituaries/sparck-jones/cv.html
  6. Computer Laboratory, University of Cambridge. [online]. 2011. [cit. 2012-05-09]. Obituries. Dostupné z: http://www.cl.cam.ac.uk/misc/obituaries/sparck-jones/cv.html
  7. The Telegraph. 2007. [cit. 2012-05-11]. Karen Spärck Jones. Dostupné z: http://www.telegraph.co.uk/news/obituaries/1548315/Karen-Sparck-Jones.html
  8. Emerald, Journal of Documentation. 2007[cit. 2012-05-11]. In memoriam: Karen Spräck Jones Dostupné z: http://www.emeraldinsight.com/journals.htm?articleid=1628268&show=html
  9. Computer Laboratory, University of Cambridge. [online]. 2011. [cit. 2012-05-09]. Obituries. Dostupné z: http://www.cl.cam.ac.uk/misc/obituaries/sparck-jones/cv.html
  10. Computer Laboratory, University of Cambridge. [online]. 2011. [cit. 2012-05-17]. Obituries. Dostupné z: http://www.cl.cam.ac.uk/misc/obituaries/sparck-jones/cv.html
  11. Women in Computer Science, American University in Bulgaria. [cit. 2012-05-11]. Women in the History of Computing Technology – Karen Spärck Jones. Dostupné z: http://cssu-bg.org/WomenInCS/karen_jones.php
  12. Ieee Spectrum Inside Technology. [online]. 2007. [cit. 2012-05-09]. Computer Science, A Woman's Work Dostupné z: http://spectrum.ieee.org/geek-life/profiles/computer-science-a-womans-work
  13. Emerald, Journal of Documentation. 2007[cit. 2012-05-11]. In memoriam: Karen Spräck Jones Dostupné z: http://www.emeraldinsight.com/journals.htm?articleid=1628268&show=html
  14. Computer Laboratory, University of Cambridge. [online]. 2011. [cit. 2012-05-09]. Obituries. Dostupné z: http://www.cl.cam.ac.uk/misc/obituaries/sparck-jones/cv.html

Externí zdroje

Computer Science, A Woman's Work. [online]. 2007. [cit. 2012-05-09]. Dostupné z: http://spectrum.ieee.org/geek-life/profiles/computer-science-a-womans-work

In memoriam: Karen Sprck Jones From: Journal of Documentation. 2007[cit. 2012-05-11]. Dostupné z: http://www.emeraldinsight.com/journals.htm?articleid=1628268&show=html