Karen Spärck Jones
Karen Spärck Jones | |
---|---|
Huddersfield | |
Datum a místo úmrtí |
4. dubna 2007 Willigham |
rakovina | |
manžel Roger Needham | |
- | |
britské | |
Vzdělání | Girton College |
Pracoviště | Cambridge |
Annual Award, Award for research ACM SIGIR, Honorary ScD, Award of Merit, Lifetime Achievement Award, ACM – AAAI Allen Newell Award, ACM Athena Lecturer, BCS Lovelace Medal | |
Známý pro | IR, NLP |
Karen Spärck Jones (26. srpna 1935, Huddersfield - 4. dubna 2007, Willingham), britská informační vědkyně, která se specializovala na vyhledávání informací (IR) a zpracování přirozeného jazyka (NLP). Těmto dvěma oblastem se věnovala již od konce padesátých let. [1]Většinu svého života učila a prováděla výzkumy např. na zpracování informací v počítačové laboratoři na půdě Cambridgské univerzity.
Život
Karen Spärck Jones se narodila v Huddersfieldu, hrabství Yorkshire, v Anglii. Její otec, Owen Jones, přednášel chemii na univerzitě a její matka byla Ida Spärck, Norka, která se přestěhovala do Británie během druhé světové války. Karen Spärck Jones absolvovala gymnázium a pak studovala historii na Girtonově univezitě od roku 1953 až do roku 1956. Po nějaký čas pracovala jako učitelka. Od roku 1974 začala pracovat v počítačové laboratoři v Cambridge a odtamtud odešla až v roce 2002. Dle slov jejích kolegů z počítačové laboratoře byla vždy plná energie, příjemná, velkorysá a vždy je neúnavně podporovala. V počítačové laboratoři pracovala ještě několik měsíců před svou smrtí.[2] Krátce předtím mohla vidět, jak její životní dílo o zpracování přirozených jazyků a vyhledávání informací dochází ještě většího ocenění než kdykoliv předtím od významných vědeckých institucí v oblasti počítačové vědy po celém světě.[3] Zemřela 4. dubna v roce 2007 na rakovinu, tři roky po svém manželovi Rogerovi Needhamovi.[4]
Zaměstnání
- 1958 – 1968 Research worker, Cambridge Language Research Unit
- 1965 – 1968 Research Fellow, Newnham College, Cambridge
- 1968 – 1988 Research positions, Computer Laboratory, University of Cambridge,Royal Society Scientific Information Research Fellow, Senior Research Associate,GEC Research Fellow
- 1988 – 2002 University of Cambridge: Assistant Director of Research,Reader in Computers and Information,Professor of Computers and Information[5]
Odborné činnosti
- 1983 – 1996 Member Alvey IKBS Committee, Alvey Natural Language Coordinator, Member IKBS Subcommittee of SERC/DTI IE ATP, Member, Foresight Panels
- 1977 – 1985 Executive Committee, Museum Documentation Association
- 1987 – 1998 Advisory Committee, British Library R&D Department
- 1987 – 1989, 1990 – 1994 Executive Committee, Association for Computational Linguistics
- 1994 – President, Association for Computational Linguistics
- 2004 – Member, UK Computing Research Committee
- 1999 – 2002 Member of Council, British Academy
- 2000 – 2002 Vice-President, British Academy
- 1975 – Editorial Boards of Journal of Documentation, Information, Processing and Management, User Modelling and User-Adapted, Interaction, Computational Linguistics, Artificial Intelligence
- 1978 – Programme Committees for Conferences including ACL Conferences, COLING, ACM/SIGIR, IJCAI, numerous workshops
- 1993 – Chair, Dagstuhl Seminar on Summarising Text
- 1993 – Programme Committee for DARPA/NIST Text Retrieval Conferences
- 2001 – Programme Committee for DARPA/NIST DUC (Summarising) Conferences
- 1999 – Joint Organiser, Royal Society/British Academy Discussion Meeting
- 1999 – Chair, Computer Laboratory Celebration EDSAC 99
- 2004 – Chair, British Academy Policy Review on e-Resources for Research
- 2005 – UKCRC Grand Challenges Steering Committee[6]
Zajímavosti
Měla hodně zálib, ale její největší vášní spolu s manželem bylo plachtění.
Práce
Profesorka Karen Spärck Jones byla jedním z průkopníků ve vyhledávání informací (IR) a zpracovaná přirozeného jazyka (NLP). Tyto dvě disciplíny z ní udělaly během její kariéry uznávaného počítačového vědce. Svou vědeckou výzkumnou dráhu začala ve výzkumném jazykové ústavu v Cambridge. Zde zkoumala využití tezaurů na zpracování jazyka. V těchto oblastech pracovala již od konce padesátých let a významnou měrou přispěla k chápání informačních systémů.
V šedesátých letech začala pracovat na IR neboli vyhledávání informací. V roce 1972 publikovala článek v Journal of Documentation, kterým definovala pojem inverzní frekvence dokumentu (IDF). Představila měření převrácené četnosti slov, což je technika, která byla přijata jako standard v moderních systémech včetně webových vyhledávačů a používá se ve většině vyhledávačů dodnes. Tato technika umožnila lidem pracovat s počítačem pomocí obyčejného slova místo rovnic a kódů. Je to statistická metoda sloužící k vyhodnocování, jak je důležité dané slovo v řadě dokumentů a jaký význam má slovo pro jednotlivý dokument. Vyhledávače díky IDF řadí důležitost odkazů na dotaz uživatele. Ačkoliv v roce 1972 to byla jen teorie, v roce 1994 se z ní stala skutečnost v rukách Mikea Burrowse použitím na Alta Vista.[7]
Následně spolupracovala s Stephenem Robertsonem na stanovení hodnoty měření relevance slov, což bylo klíčovým krokem ve vývoji velmi úspěšného pravděpodobnostního modelu získávání informací, který dále rozvíjela.
Později se věnovala zpracování přirozeného jazyka, kde provedla důležitou práci zejména k přístupu k databázím a heterogenních systémů informačních dotazů.
Nověji pracovala na vyhledávání dokumentů, včetně řečových aplikací, vyhledávání v databázích, modelování uživatele a agenta, sumarizování informací a hodnocení informačních systémů a jazykových systémů.[8]
Hrazené výzkumné projekty
- 1965 – 1969 Automatic classification for information retrieval (OSTI)
- 1974 – 1983 Projects on Information Retrieval, Test Collections (BLR&DD)
- 1979 – 1993 Projects on Natural Language Processing and Inference for Database Access, Integrated Inquiry, Automatic Summarising (SERC)
- 1990 – 1993 Automated Information Intermediary (ESRC/MRC/SERC)
- 1990 – 1992 Core Language and Reasoning Engine (SERC/DTI and collaborators)
- 1993 – 1996 Video Mail Retrieval, with Engineering Department, ORL (SERC/DTI)
- 1997 – 2000 Multimedia Document Retrieval, with Engineering (EPSRC)[9]
Přednášky na odborných konferencích
- 1986 Workshop on the Foundations of Artificial Intelligence, Las Cruces
- 1988 Annual Convention of the Computer Society of India, Madras
- 1988 Keynote Speaker, RIAO 88 Conference, Cambridge MA
- 1988 ACM SIGIR Annual International Conference, Grenoble
- 1989 British Library Annual Research Lecture
- 1992 Association for Computational Linguistics Annual Conference
- 1993 First German Information Retrieval Conference, Regensburg
- 1994 Grace Hopper Celebration of Women in Computing, Washington
- 1994 Presidential Address, Association for Computational Linguistics
- 1995 Symposium on Document Analysis and Information Retrieval, Las Vegas
- 1997 Latsis Symposium on Information and Communication, ETH Zurich
- 2002 Grace Hopper Lecture, University of Pennsylvania
- 2003 European Conference on Digital Libraries, Trondheim
- 2004 W.C. Williams Lecture, University of Sheffield
- 2004 Lazerow Lecture, University of California, Los Angeles
- 2004 Award Lecture, Association for Computational Linguistics
- 2005 Salton Lecture, Cornell University
- 2005 Second International Conference on Language Processing, S Korea[10]
Aktivity
Karen Spärck Jones byla členkou v British Academy a v letech 2000-2002 v ní vykonávala funkci viceprezidentky. Byla také členkou AAAI (American Association for Artificial Intelligence) a ECCAI (European Coordinating Committee for Artificial Intelligence). V roce 1994 působila jako prezidentka Association for Computational Linguistics a promluvila na její první konferenci Grace Hopper.[11] Byla členkou programového výboru DARPA/NIST konferencí textového vyhledávání (TREC) od roku 1994, a účastnila se ostatních programů hodnocení v USA, zejména konferencí porozumění dokumentům v automatickém shrnutí.
Pomohla založit the Intelligent Knowledge Based System - výzkumný prostor ve Velké Británii, v Alvey programu, který financoval stovky projektů a přinesl obrovskou podporu AI (Artificial inteligence - umělá inteligence) a jazykové práce ve Velké Británii v osmdesátých letech. Mnoho let učila na univerzitě v Cambridge obor počítačové řeči a zpracování jazyka. Zde také dohlížela na mnoho doktorandských prací z oblastí zpracování přirozeného jazyka a vyhledávání informací.
Byla velkým zastáncem časopisu Journal of Documentation, kde nejen publikovala své články, ale v letech 1975 – 1985 byla členem redakční rady a v letech 1977 – 1980 se stala šéfredaktorem.
Celý život bojovala za větší zastoupení žen ve výpočetní technice, jejím sloganem bylo - ve volném překladu: „Počítačová věda je příliš důležitá na to, aby byla ponechána pouze mužům“.[12]
Význam pro informační vědu a knihovnictví
Zasloužila se o ohromný pokrok ve vyhledávání informací a snažila se vytvořit nejlepší pravděpodobnostní model na vyhledávání dokumentů, informací a jazyka. Jeden z jejích nejdůležitějších přínosů byl koncept TF/IDF - term frequency / inverse document frequency. TF/IDF je v dnešní době používán ve většině vyhledávačů. Tato metoda umožňuje lidem pracovat s počítači za použití běžných slov namísto rovnic nebo kódů. TF/IDF posuzuje význam dokumentu podle frekvence výskytu klíčových slov v porovnání s frekvencí těchto slov v širším souboru dokumentů.[13]
Ocenění
Dosáhla nejprestižnějších ocenění za svou činnost jako výzkumnice ve svém oboru.
- 1983 – Annual Award, for research, Institute of Information Scientists
- 1988 – Award, for research, ACM SIGIR (now Salton Award)
- 1997 – Honorary ScD, City University
- 2002 – Award of Merit, American Society for Information Science and Technology
- 2004 – Lifetime Achievement Award, Association for Computational Linguistics
- 2006 – ACM – AAAI Allen Newell Award
- 2007 – ACM Athena Lecturer
- 2007 – BCS Lovelace Medal[14]
Publikace
Karen Spärck Jones napsala 9 knih a velmi mnoho časopiseckých článků. Její publikace jsou hodně citované v literatuře, v současné době existuje více než 1500 citací v databázi Web of Science a přes 4500 citací v Google Scholar.Mnoho prací bylo vydáno v Journal of Documentation, dva z nich byly následně znovu otištěny v sérii článků „60 years of the best in information research“.
Monografie
SPÄRCK JONES, Karen a Ann COPESTAKE, Stephen ROBERTSON. Selected Papers of Karen Sparck Jones. Center for the Study of Language and Information, 2008, 350 Pages. ISBN 1575865696.
SPÄRCK JONES, Karen and Yorick WILKS. Automatic Keyword Classification for Information Retrieval. Archen Books, 2007. ISBN 020801201X.
SPÄRCK JONES, Karen and A. J. HERBERT, Robert NEEDHAM. Computer Systems: Theory, Technology and Applications. Springer, 2004, 355 pages. ISBN 038720170X.
SPÄRCK JONES, Karen and Peter WILLETT. Readings in Information Retrievel. San Francisco: Morgan Kaufmann Publishers, 1997, 587 pages. ISBN 1558604545.
SPÄRCK JONES, Kare nand Julia Rose GALLIERS. Evaluating Natural Language Processing Systems: An Analysis and Review. 1996, 243 pages. ISBN 3540613099.
SPÄRCK JONES, Karen and Peter WILLETT. Synonymy and Semantic Classification. Edinburgh: Edinnburgh University Press, 1987. ISBN 0852245173.
SPÄRCK JONES, Karen. Automatic Natural Langure Parsing. Ellis Horwood, 1983, 208 pages. ISBN 0853126216.
SPÄRCK JONES, Karen. Information Retrievel Experiment. Butterworth-Heinemann, 1982, 352 pages. ISBN 0408106484.
SPÄRCK JONES, Karen and Martin KAY. Linguistics and Information Science. Academic Press, 1974, 244 pages. ISBN 0126562504.
Články
Karen Spärck JONES. Some points in a time. Computational Linguistics, 31, 2005, 1-14.
Karen Spärck JONES. What's new about the Semantic Web? Some questions. ACM SIGIR Forum, 38 (2), December 2004, 18-23.
Karen Spärck JONES. Collective intelligence: it's all in the numbers. IEEE Intelligent Systems, 21 (3), 2006, 64-65.
Karen Spärck JONES. What's the value of TREC - is there a gap to jump or a chasm to bridge? ACM SIGIR Forum, 40 (1), 2006, 10-20.
Karen Spärck JONES. Automatic language and information processing: rethinking evaluation. Natural Language Engineering, 7, 2001, 1-18.
Karen Spärck JONES. Information retrieval and artificial inteligence. Artificial Intelligence, 114 (1-2), 1999, 257-281.
Karen Spärck JONES. Further reflections on TREC. Information Processing and Management, 36, 2000, 37-85.
Karen Spärck JONES. The way forward in information retrieval. Elsnews 6.3, 1997, 12-13.
Karen Spärck JONES. Summarising as a lever for studying large-scale discourse structure. ACL Workshop on Intentionality and Structure in Discourse Relations, 1993, 125-127.
Karen Spärck JONES. The role of artificial intelligence in information retrieval. Journal of the American Society for Information Science, 42, 1991, 558-565.
Karen Spärck JONES. Notes and references on early classification work. ACM SIGIR Forum, 25(1), 1991, 10-17.
Karen Spärck JONES. User models, discourse models, and some others. Computational Linguistics, 14 (3), 1988, 98-100.
Karen Spärck JONES. User models and expert systems. Computer Laboratory, University of Cambridge, 1984.
Karen Spärck JONES. UK initiatives on intelligent knowledge based systems. AISB Quarterly, No. 45, 1982, 23-25.
Karen Spärck JONES. Statistically-based document indexing. Skrifter om Anvendt og Matematisk Lingvistik, 6, 1980, 79-93.
Karen Spärck JONES. Performance averaging for recall and precision. Journal of Informatics, 2, 1978, 95-105.
Karen Spärck JONES. Intelligent automatic information retrieval. Journal of Informatics, 3, 1979, 75-88.
Karen Spärck JONES. Automatic indexing 1974: a state of the art review. Computer Laboratory, University of Cambridge, 1974 (OSTI Report 5193).
Karen Spärck JONES. A performance yardstick for test collections. Journal of Documentation, 31, 1975, 266-272.
Karen Spärck JONES. Automatic thesaurus construction and the relation of a thesaurus to indexing terms. Aslib Proceedings, 22, 1970, 26-28.
Karen Spärck JONES. Experiments in semantic classification. Mechanical Translation, 8, 1965, 97-112.
Karen Spärck JONES. Semantic classes and semantic message forms. Proceedings of the Conference on Computer-related Semantic Analysis,1965, X1-X17.
Karen Spärck JONES.Semantic markers. Cambridge Language Research Unit, 181, 1965.
Karen Spärck JONES. Current work on automatic classification for information retrieval. T.A. Informations, No. 2, 1967, 92-96.
Doporučení četba
Její disertační práce je povážována za velmi pokrokovou. Psala ji na téma “Synonymie a schématické klasifikace”. Práce je výjimečná ve zkoumání statistických, kombinovaných technik a symbolické technice v NLP.
Použitá literatura
- ↑ Computer Laboratory, University of Cambridge. [online]. 2011. [cit. 2012-05-09]. Karen Spärck Jones, FBA Professor Emerita of Computers and Information Honorary Fellow of Wolfson College 26 August 1935 – 4 April 2007. Dostupné z: http://www.cl.cam.ac.uk/misc/obituaries/sparck-jones/
- ↑ Wikipedia, The free Encyklopedia. [online]. 2012. [cit. 2012-05-09]. Karen Spärck Jones. Dostupné z:http://en.wikipedia.org/wiki/Karen_Sp%C3%A4rck_Jones
- ↑ Ieee Spectrum Inside Technology. [online]. 2007. [cit. 2012-05-09]. Computer Science, A Woman's Work Dostupné z: http://spectrum.ieee.org/geek-life/profiles/computer-science-a-womans-work
- ↑ Computer Laboratory, University of Cambridge. [online]. 2011. [cit. 2012-05-09]. Obituries. Dostupné z: http://www.cl.cam.ac.uk/misc/obituaries/sparck-jones/cv.html
- ↑ Computer Laboratory, University of Cambridge. [online]. 2011. [cit. 2012-05-09]. Obituries. Dostupné z: http://www.cl.cam.ac.uk/misc/obituaries/sparck-jones/cv.html
- ↑ Computer Laboratory, University of Cambridge. [online]. 2011. [cit. 2012-05-09]. Obituries. Dostupné z: http://www.cl.cam.ac.uk/misc/obituaries/sparck-jones/cv.html
- ↑ The Telegraph. 2007. [cit. 2012-05-11]. Karen Spärck Jones. Dostupné z: http://www.telegraph.co.uk/news/obituaries/1548315/Karen-Sparck-Jones.html
- ↑ Emerald, Journal of Documentation. 2007[cit. 2012-05-11]. In memoriam: Karen Spräck Jones Dostupné z: http://www.emeraldinsight.com/journals.htm?articleid=1628268&show=html
- ↑ Computer Laboratory, University of Cambridge. [online]. 2011. [cit. 2012-05-09]. Obituries. Dostupné z: http://www.cl.cam.ac.uk/misc/obituaries/sparck-jones/cv.html
- ↑ Computer Laboratory, University of Cambridge. [online]. 2011. [cit. 2012-05-17]. Obituries. Dostupné z: http://www.cl.cam.ac.uk/misc/obituaries/sparck-jones/cv.html
- ↑ Women in Computer Science, American University in Bulgaria. [cit. 2012-05-11]. Women in the History of Computing Technology – Karen Spärck Jones. Dostupné z: http://cssu-bg.org/WomenInCS/karen_jones.php
- ↑ Ieee Spectrum Inside Technology. [online]. 2007. [cit. 2012-05-09]. Computer Science, A Woman's Work Dostupné z: http://spectrum.ieee.org/geek-life/profiles/computer-science-a-womans-work
- ↑ Emerald, Journal of Documentation. 2007[cit. 2012-05-11]. In memoriam: Karen Spräck Jones Dostupné z: http://www.emeraldinsight.com/journals.htm?articleid=1628268&show=html
- ↑ Computer Laboratory, University of Cambridge. [online]. 2011. [cit. 2012-05-09]. Obituries. Dostupné z: http://www.cl.cam.ac.uk/misc/obituaries/sparck-jones/cv.html
Externí zdroje
Computer Science, A Woman's Work. [online]. 2007. [cit. 2012-05-09]. Dostupné z: http://spectrum.ieee.org/geek-life/profiles/computer-science-a-womans-work
In memoriam: Karen Sprck Jones From: Journal of Documentation. 2007[cit. 2012-05-11]. Dostupné z: http://www.emeraldinsight.com/journals.htm?articleid=1628268&show=html