kawauso@sfc.wide.ad.jp 8 12 21
Abstract
Abstract Presently the amount of informati on that ows through the wi de-area i nformati on system, has far exceeded the human capaci ty to transact. At themomen t, the only resolutiontothisinformation overow problem isto restrictthe amoun t of information lines. Another woul d be, the real izati onof Network Agen ts that can mak e sel ecti ve i nformati on retri eve possible.this canbeananswer to the problems related to the overow. Because the act of automati c info-retri evemen t/di spatchmen t substi tutes for human intel l ectual act, much study and research i s necessary to overcome the techni cal di cul ties,as wel l as bri ngi ng i t to practi cal use. The technicalproblems dealt with information lteringis similarinman yways with that ofthe database el d. Because most of the research, especi al lyin the i nformati on l tering of text-based do cumen ts can be used di rectly,there are al ready some servi ces on the network that mak e use of thi s. One typicalinformation lteringwould be the prole system where the information isautomatical l ysel ectedand sorted out. The computer then compares thi s prol e to each i ncomi ng i nformati on, and calculates the importance and comes up with a score. If the score is over the threshold, itispassed on tothe client. If not, itisdismissed. If this lteringprocess i s unstable and immature, there i s a possibilitythat important i nformation will be thrown away orcause an overow of unnecessary information. Presen tl y, research eorts on i nformati on l tering isfocused on the maki ng and eecti veness of ltering. They are attempting to providemore accurate and fast information ltering. In this research, Wefocused on theprocess i n providing requested information to the clientfrom the gi ven prol e. In thi s thesi s, we prop osed a new l tering scheme \Informati on Scal ing" whi c h impro ve the accuracy and eci ency of the l tering.
1 2 1.1 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 3 1. 2 : : : : : : : : : : : : : : : : : : : : : : : : : : : : 3 2 4 2. 1 : : : : : : : : : : : : : : : : 5 2. 1. 1 MHE : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 5 2. 1. 2 GNUS : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 5 2. 1. 3 MHE GNUS : : : : : : : : : : : : : : : : : : : : : : : : 5 2. 2 : : : : : : : : : : : 5 2. 2. 1 : : : : : : : : : : : : : : : : : : : : : : : : : : 6 2. 2. 2 WWW : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 7 2. 2. 3 : : : : : : : 7 2. 3 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 7 3 9 3. 1 : : : : : : : : : : : 10 3. 2 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 10 3. 2. 1 : : : : : : : : : : : : : : : : : : : : : : : : : : 11 3. 2. 2 : : : : : : : : : : : : : : : : : : : : : : : 13 3. 3 : : : : : : : : : : : : : : : 15 3. 3. 1 SIFT : : : : : : : : : : : : : : : : : : : : : : : : : 15 3. 4 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 16 3. 5 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 18 3. 5. 1 : : : : : : : : : : : : : : : : : : : : : : : : 18 4 20 4. 1 : : : : : : : : : : : : : : : : : 21 4. 2 : : : : : : : : : : : : 22 4. 2. 1 : : : : : : : : : : : : : : : : : : : : : : : 22 4. 2. 2 : : : : : : : : : : : : : : : : : : : : : 23 4. 2. 3 : : : : : : : : : : : : : : : : : : : : : : : : 23
5 26 5.1 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 27 5.2 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 27 30 ii
2.1 MHE, GNUS : : : : : : : : : : : : : : : : : 6 2. 2 : : : : : : : : : : : : : : : : : : : : : : : : : : 6 2. 3 : : : : : : : : : : : : : : : : : 7 3. 1 [Mor93] : : : : : : : : : : 11 3. 2 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 12 3. 3 SIFT : : : : : : : : : : : : 13 3. 4 SIFT : : : : : : : : : : : : : : : : : : : 14 3. 5 MHE GNUS : : : : : : : : : : : : : : : : : : : : 17 3. 6 : : : : : : : : : 17 3. 7 [Han91] : : : : : : : : : : : : : : : : : : : 19 4. 1 : : : : : : : : : : 21 4. 2 : : : : : : : : : : : : : : : : 22 4. 3 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 23 4. 4 : : : : : : : : : : : : : : : : : : : : : : : : : : : : 24 4. 5 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 24 4. 6 : : : : : : : : : : : : : : : : : : : : : : : : : : : 25 4. 7 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 25 4. 8 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 25
1
1.1 3 1. 2 3 1. 2. 3.
2
2.1 5 2.1.1 MHE emacs MHE 2.1.2 GNUS emacs GNUS GNUS 2.1.3 MHE GNUS MHE GNUS (2.1) (2.2) 2. 2 MHE GNUS
6 Figure 2.1: MHE, GNUS Fi g ur e2. 2: (2. 3) 2.2. 1 CD-ROM (2.3)
7 Figure 2.3: 2.2. 2 WWW WWW 2. 2. 3 MHE Mosai c 2.3 MH E Mo s a i c MH E Mo s a i c
MHE Mosaic WWW 8
3
3.1 10 3. 2 (3.1)
11 Figure 3.1: [Mor93] 3.2.1 Boolean Vector Space Mo del VectorSpace Mo del
relevance feedback 12 (3.2) Figure 3.2: JUMAN WAIS Vector Space Mo del Information Lens WAIS WAIS WAIS WAIS TeX
vector space model 13 SIFT WAIS 7500 (3.3) Figure 3.3:SIFT (3.4) WWW 3.2.2 (3.4)
14 Figure 3.4: SIFT chknews chknews[mor94] chknews Autodesk Autodesk[ Bac92] Lyric-Ti me system Lyri c-timesystem[loe92]
15 3.3 3.3. 1 SIFT SIFT 3 3 SIFT SIFT MHE SIFT SIFT SIFT 3 SIFT SIFT 3 3
3 SIFT 3 16 SIFT SIFT A A 3.4 SIFT SIFT MHE GNUS (3.5) I 1 ;I 2 ;I 3 MHE GNUS M M I 1 ;I 2 ;I 3 MHE (3.6)
17 Figure 3.5: MHE GNUS Fi g ur e3. 6: F F S(I 1 )=28;S(I 2 )=3;S(I 3 )=75 50 50 I 3 F F I 3 I 1 ;I 2 ;I 3 ; I 1 ;I 2 F I 3 F
F 18 3.5 3.5.1 ( ) [Fur8 6] ( 3.7) DOI( Degr e eof I nte r e st,) DOI (x) API ( apr io r interest ) (o) D( o, x) DOI DOI
19 Figure 3.7: [Han91] [ Ohk93] [ Hat94] [ Ohk93]
4
4.1 21 (4.1) Figure 4. 1: I 1 ;I 2 ;I 3 D 1 3 D I1 =0:3;D I2 =0:3;D I3 =0:3 S S S(I 1 )=28;S(I 2 )=3;S(I 3 )=75 D I1 =0:26;D I2 =0:028;D I3 =0:71
22 4.2 ([Del93]) ( 4.2) Figure 4.2: 4.2.1
4.2.2 23 3 3 4.2.3 800 (4.3) Figure 4. 3: (4.4)
24 Figure 4.4: (4. 5) Figure 4. 5: log(n keyword ) 3 W keyword 3 W document S document N keyword W keyword W document S document W document 1
25 (4.5) (4.6) Figure 4. 6: (4.7) (4.8) Figure 4. 7: Figure 4. 8: 10
5
5.1 27 5. 2 2
+ 28
MMM
Bibliography [Yan94] Tak W. Yan, Hector Garcia-Moli na:sift - A Tool for Wide-Area Inf ormati on Di sseminati on,1994. f tp: //db.stanford.edu/pub/sift/sift.ps [ Ohk93] Masaaki Ohkub o, Naoki Kobayashi,andToru Nak agawa: Desi gn of an Informati on Skimming Space, Proceedings of the ACM Multi media 93,pp. 365-371, Aug 1993. [ Bel 92]Nichol asj. Bel kin:informati onfilteringand Informati onretrieval : TwoSides of the Same coi n?,comm unications oftheacm,vol. 35,No. 12, pp. 29-37,Dec 1992. [Mor94] :, JAIN Symposium, Jan 1994. http: //www. jai st. ac. j p/j ai st/i s/l abs/shino da- l ab/papers/home- j. html [Mor93] :, (), Vol. 93,No. 153, Jul y 1993. http: //www. j ai st. ac. j p/j ai st/i s/l abs/shino da- l ab/papers/home- j. html [Loe92] Shoshana Loeb:ArchitechingPersonalizedDeliveryof Mutimedia Informati on, Comm unications oftheacm,vol. 35,No. 12, pp. 39-47, Dec 1992. [Mur95] : WAIS, Software Desi gn, pp. 33-40,Feb 1995. [Hat94] :,,vol.3,pp393-416, 1994. [Par91] K. Parsaye, M. Chignell,S. Khoshaan, H.Wong, :,, 1992. [ Fur 86] Fur nas, G. W.: Gener al i zeds heye vi ews, CHI'86 Pro ceedings, Bos t on, MA, pp. 16-23 [Bac92] Paul.E.Bacl ace:comp etitiveagen ts f or I nformati on Filtering,Comm unications oftheacm,vol. 35,No. 12, pp. 50-60,Dec 1992. 30
31 [Del93] L. Del gross i, C. Hal stri ck, D. Hehmann, R. G. Her rtwi ch, O. Kr one, J. Sandvos s, C. Vogt: Medi a Scal i ngfor Audi ovi s ual Comm uni cat i onwi t h he Hei del ver g Tr ans por t Sys temproceedings of the ACM Multi medi a 93, pp. 99-104, Aug 1993.