</ul> (XXX ) 15 ( )15 35 (XXX ) 15 ( ) [4] HTML HTML HTML HTML 1. <!--- CONTENTS_TITLE_TABLE ---> <b><font size=+1>xxx </font></b> <sm

Similar documents
2. HTML csh AWK AWK 1., 2., 3. 2 HTML HTML HyperText Markup Language WWW WWW (.html

Web

6 2 1

JavaScript 1.! DOM Ajax Shelley Powers,, JavaScript David Flanagan, JavaScript 2


ohp.mgp

/

( ) Shift JIS ( ) ASCII ASCII ( ) 8bit = 1 Byte JIS(Japan Industrial Standard) X 0201 (X ) 2 Byte JIS ISO-2022-JP, Shift JIS, EUC 1 Byte 2 By

1

( ) 1 Windows HTML ( ) ( ) ( ) WWW 10 ( )

■サイトを定義する

演習室の PC のハードディスクには演習で作成したデータは保管できません 各 PC の ネットワーク接続 ショートカットからメディア情報センターのサーバーにアクセスしてください (Z ドライブとして使用できます ) 演習名 使用するフォルダ 演習 1 Z: Web データ管理 演習


untitled

6 2 s µ µµµ µµµµ µ µ h µs µ µµµµ µ µ µ s mµµµµµ µµµ µµ µ u m µmµµµµµ µµ µ µ µ µ µ µ µ µ s 1

Web プログラミング 1 JavaScript (4) (4 章 ) 2013/7/17( 水 ) 日時 講義内容 4/10 ( 水 ) ガイダンス Web (1 章 ) 4/17 ( 水 ) HTML+CSS (1) (2 章 ) 4/24 ( 水 ) HTML+CSS (2) (2 章 ) 5

ÉvÉçPM_02

リスト 1 1 <HTML> <HEAD> 3 <META http-equiv="content-type" content="text/html; charset=euc-jp"> 4 <TITLE> 住所の検索 </TITLE> 5 </HEAD> 6 <BODY> <FORM method=

1

(2 Linux Mozilla [ ] [ ] [ ] [ ] URL 2 qkc, nkc ~/.cshrc (emacs 2 set path=($path /usr/meiji/pub/linux/bin tcsh b

World Wide Web =WWW Web ipad Web Web HTML hyper text markup language CSS cascading style sheet Web Web HTML CSS HTML

javascript key


~/WWW-local/compIID (WWW IID ) $ mkdir WWW-local $ cd WWW-local $ mkdir compiid 3. Emacs index.html n (a) $ cd ~/WWW/compIID


untitled

Networking Semester 802.3

演習室の PC のハードディスクには演習で作成したデータは保管できません 各 PC の ネットワーク接続 ショートカットからメディア情報センターのサーバーにアクセスしてください (Z ドライブとして使用できます ) 講義で使うフォルダ 2/23

~モバイルを知る~ 日常生活とモバイルコンピューティング


Web±ÜÍ÷¤Î³Ú¤·¤µ¤ò¹â¤á¤ëWeb¥Ú¡¼¥¸²ÄÄ°²½¥·¥¹¥Æ¥à



JavaScript演習

HTML文書の作成

インターネット社会の発展

Webデザイン論

C G I 入 門 講 座

A/B (2018/10/19) Ver kurino/2018/soft/soft.html A/B

soturon2013

FileList Convert a pdf file!

2.4.7 \ AWK AWK......

h1,..., h6: (heading) h1 h2 table: table tr (table row) tr td (table data) ol, ul: (ordered) (unordered) </tag1> </tag4> 1: HTML [1] html: Web HTML he

10/ / /30 3. ( ) 11/ 6 4. UNIX + C socket 11/13 5. ( ) C 11/20 6. http, CGI Perl 11/27 7. ( ) Perl 12/ 4 8. Windows Winsock 12/11 9. JAV

CSS

演習室の PC のハードディスクには演習で作成したデータは保管できません 各 PC の ネットワーク接続 ショートカットからメディア情報センターのサーバーにアクセスしてください (Z ドライブとして使用できます ) Web プログラミング 1 CGI (3 章 ) 2012/6/12( 水 ) 講義


2 / 16 HTML=HyperText Markup Language( ハイパーテキストマークアップランゲージ ) ブラウザ (Chrome) での表示 ソースの表示 ( メモ帳 /TeraPad) HTML <========= =========>

untitled

m_sotsuron

54 5 PHP Web hellow.php 1:<?php 2: echo "Hellow, PHP!Y=n"; 3:?> echo PHP C 2: printf("hellow, PHP!Y=n"); PHP (php) $ php hellow.php Hellow, PHP! 5.1.2

johokiso-char.pdf.pdf

インターネットマガジン2003年3月号―INTERNET magazine No.98

内容 WWWとは ブラウザ 検索エンジン HTML 自分のホームページ作成

Web のしくみと応用 ('15) 回テーマ 1 身近なWeb 2 Webの基礎 3 ハイパーメディアとHTML 4 HTMLとCSS 5 HTTP (1) 6 HTTP (2) 7 動的なWebサイト 8 クライアントサイドの技術 回 テーマ 9 リレーショナルデータベース 10 SQL とデータ

II ( ) prog8-1.c s1542h017%./prog8-1 1 => 35 Hiroshi 2 => 23 Koji 3 => 67 Satoshi 4 => 87 Junko 5 => 64 Ichiro 6 => 89 Mari 7 => 73 D

橡点検記録(集約).PDF

~モバイルを知る~ 日常生活とモバイルコンピューティング

SVG資料第10回目(その2) Ajaxによる同期通信と非同期通信の違い

ex12.dvi

II 3 yacc (2) 2005 : Yacc 0 ~nakai/ipp2 1 C main main 1 NULL NULL for 2 (a) Yacc 2 (b) 2 3 y

<td width=99%><input type="file" size="80" name="file"></td> <td width=1% nowrap align=right valign=top> 削除キー : </td> <td width=99%><input type="passw

スタートアップガイド_応用編

経営論集2011_07_小松先生.indd

WebOS aplat WebOS WebOS 3 XML Yahoo!Pipes Popfry UNIX grep awk XML GUI WebOS GUI GUI 4 CUI

Network Computing の基礎

untitled

07_経営論集2010 小松先生.indd

r07.dvi

div: 3 span: 4 h1,..., h6: (heading) h1 h2 </tag1> table: table tr (table row) tr td (table data) ol, ul: (ordered) (unordered) </tag4> 1: HTML

ohp07.dvi

hands_on_4.PDF

裏技情報ファイル3

Java

CSS CSS

山梨県ホームページ作成ガイドライン

II 2 p.2 2 GET POST form action URL Aisatsu 2.1 Servlet GET GET : Query String QueryStringTest.java 1 import java.io.ioexception; 2 import java.io.pri

PowerPoint Presentation

£Ã¥×¥í¥°¥é¥ß¥ó¥°ÆþÌç (2018) - Â裶²ó ¨¡ À©¸æ¹½Â¤¡§·«¤êÊÖ¤· ¨¡

オンラインテスト

untitled

新・明解C言語 ポインタ完全攻略

3 Powered by mod_perl, Apache & MySQL use Item; my $item = Item->new( id => 1, name => ' ', price => 1200,

Taro-cshプログラミングの応用.jt

wide94.dvi

joho07-1.ppt

untitled

Microsoft Word - C.....u.K...doc

地域と文化資産


10


1.ppt

lexex.dvi

Web データ管理 JavaScript (3) (4 章 ) 2011/12/21( 水 ) 湘南工科大学講義資料 Web データ管理 (2011) 阿倍 1/18


CSSNite-LP54-kubo-ito.key


Webデザイン論


Transcription:

1. 1 2006 9 5 AWK HTML 2 1 [4] AWK Yahoo! : http://headlines.yahoo.co.jp/hl HTML HTML [4] HTML HTML ( ) HTML 3 2 Yahoo! Yahoo! <ul> </ul> ( ) <ul> <li><a href="[ URL]"> </a><small> (XXX ) - 15 ( )15 35 </small><br> <li><a href="[ URL]"> </a><small> (XXX )" - 15 ( )15 30 </small><br>

3. 2... </ul> (XXX ) 15 ( )15 35 (XXX ) 15 ( )15 30... [4] HTML HTML HTML HTML 1. <!--- CONTENTS_TITLE_TABLE ---> <b><font size=+1>xxx </font></b> <small> - 8 15 ( )15 40 </small></td> 2. <!--- OUTLINE_TABLE ---> (<ul> </ul> ) 3 AWK 1 AWK

3. 3 awk -f [ ] [ 1] [ 2]... [ 1] [ 2] awk cat [ 1] [ 2]... awk -f [ ] 2 FILENAME : FNR : NR : ARGIND : AWK AWK AWK ( ) C ARGV ARGC ARGC : AWK ARGV : (ARGV[0] ARGV[ARGC 1]) awk -f test.awk -v s=3 file1 file2 -f test.awk -v s=3 AWK ARGC = 3 ARGV[0]="awk", ARGV[1]="file1", ARGV[2]="file2"

4. 4 test.awk file1, file2 2,3 # BEGIN{ for(j=1;j<=argc;j++) printf "ARGV[%d]=%s\n",j-1,ARGV[j-1] { printf "(FILENAME,FNR,NR,ARGIND)" printf "=(%s,%d,%d,%d)\n",filename,fnr,nr,argind ARGV[0]=awk ARGV[1]=file1 ARGV[2]=file2 (FILENAME,FNR,NR,ARGIND)=(file1,1,1,1) (FILENAME,FNR,NR,ARGIND)=(file1,2,2,1) (FILENAME,FNR,NR,ARGIND)=(file1,3,3,1) (FILENAME,FNR,NR,ARGIND)=(file2,1,4,2) (FILENAME,FNR,NR,ARGIND)=(file2,2,5,2) (FILENAME,FNR,NR,ARGIND)=(file2,3,6,2) ARGIND 1 4 <b><font size=+1> getline sub() getline: $0 1, 0, 1 sub(r,s,c): c ( $0) r s ARGIND 1

5. 5 ##### ##### (ARGIND == 1 && $0 ~ /<b><font size=\+1>/){ sub(/.*<b><font size=\+1>/,"") sub(/<\/font><\/b>.*/,"") title=$0 getline sub(/.*<small> - /,"") sub(/<\/small>.*/,"") date=$0 / / + (1 ) \.*. = 1.* = 1 0 sub(/<\/small>.*/,"") </small> "" 5 2 <li> <ul> <li>...<br><li>...<br><li>...<br><li>...<br><li>...<br><br> <li>...<br><li>...<br><li>...<br><li>...<br><li>...<br><br> <li>...<br><li>...<br><li>...<br><li>...<br><li>...<br><br>... </ul>

5. 6 (... ) (5 ) <br> 2 1 <li> <ul> </ul> ( </ul> ) HTML <ul> </ul> <ul> </ul> getline getline <ul> </ul> [4] AWK ##### ##### ($0 ~ /<ul>/){ sub(/<ul>/,"") if($0!~ /<li>/) getline do{ # (1) 1 <li> # (2) getline while($0!~ /<\/ul>/) if($0 ~ /<li>/){ sub(/<\/ul>/,"") # (1) 1 <li> # (2) ( (1),(2)) 2 1 getline ($0 ~ /<ul>){ sub(/<ul>/,"") do{ getline

5. 7 # (1) 1 <li> # (2) while($0!~ /<\/ul>/) <ul> <li> </ul> (1),(2) (1),(2) 1 : ##### 2 ##### ($0 ~ /<ul>){ sub(/<ul>/,"") flag=0 do{ if(flag==1 $0!~ /<li>/) getline flag=1 if($0 ~ /<\/ul>/ && $0!~ /<li>/) break # (1) 1 <li> # (2) while($0!~ /<\/ul>/) if <ul> </ul> 1 if 2 if if (1),(2) (2) END

6. 8 6 5 (1) split() split(s, h, r): s r h <li>( )<br><li>( )<br><li>( )<br><br> str N=split(str,h,/<br>/) N h : N=5, h[1]="( )", h[2]="( )", h[3]="( )", h[4]="", h[5]="" 2 <br> split() <li>( )<br><li>( )<br><li>( )<br></ul> split() N=4, h[1]="( )", h[2]="( )", h[3]="( )", h[4]="</ul>" <br> </ul> split() sub(/<br>(<br> <\/ul>)? *$/,"",str) N=split(str,h,/<br>/) sub()

7. 9 (<br> <\/ul>) = <br> </ul> (<br> <\/ul>)? = (<br> </ul>) 0 1 <br>(<br> <\/ul>)? = <br> <br><br> <br></ul> <br>(<br> <\/ul>)? *$ = 0 7 5 (2) Yahoo! <li> <li><a href="http://headlines.yahoo.co.jp/..."> </a> <small> (XXX ) - 15 ( )15 35 </small> ( 1 ) (http:// ) HTML URL URL : <li><a href="data/20060815/00003.html"> </a> <small> (XXX ) - 15 ( )15 35 </small> URL HTML http://... <a> <li> <a>

7. 10 <a href="url"> : URL <a name=" "> : <a href="url" target=" "> : URL target 2 WWW WWW target target <a href="url"> a href "URL" > "URL" > match() substr() match(s,r): s r (s ) ( 0 ) RSTART (= r ) RLENGTH (= r ) substr(s,n,len): s n len ( s ) match() a match(str,/<a href=\"[^\"]+\">/) [^\"] = " 1 [^\"]+ = " 1 \"[^\"]+\" = " " (" ) <a href=\"[^\"]+\"> = <a href=" "> RSTART+RLENGTH

8. 11 substr(str,1,rstart+rlength-2) = a > substr(str,rstart+rlength-1) = a > str <li> if(match(str,/<a href=\"[^\"]+\">/)==0) print str else{ printf "%s",substr(str,1,rstart+rlength-2) printf " target=\"targetframe\"" printf "%s\n",substr(str,rstart+rlength-1) a target <li> j <li> if(j%5==0) printf "<br><br>\n"; j%5==0 j 5,10,15,... 5 5 if(j%5==0) printf "<br>( %d )<br><br>\n",j; 8 HTML [4] 6 2 7 BEGIN{ if(target=="") TARGET="yahoonews" # if(div=="") DIV=5 # N=0 # h[]:

8. 12 ##### ##### (ARGIND == 1 && $0 ~ /<b><font size=\+1>/){ sub(/.*<b><font size=\+1>/,"") sub(/<\/font><\/b>.*/,"") TITLE=$0 getline sub(/.*<small> - /,"") sub(/<\/small>.*/,"") DATE=$0 ##### ##### ($0 ~ /<ul>/){ sub(/<ul>/,"") if($0!~ /<li>/) getline do{ # (1) 1 <li> N=divideline($0,h,N) getline while($0!~ /<\/ul>/) if($0 ~ /<li>/){ sub(/<\/ul>/,"") # (1) 1 <li> N=divideline($0,h,N) ##### END ##### END{ putheader(date,title,n) print "<ul>" for(j=1;j<=n;j++){ put1list(h[j],target) if(j%div==0) printf "<br>( %d )<br><br>\n",j print "</ul>" putfooter() ##### ##### # <li> function put1list(str,target) { if(match(str,/<a href=\"[^\"]+\">/)==0) print str

8. 13 else{ printf "%s",substr(str,1,rstart+rlength-2) printf " target=\"%s\"",target printf "%s\n",substr(str,rstart+rlength-1) # <br> h ( h[1]~h[n] ) function divideline(str,h,n, tmp,j,m) { sub(/<br>(<br> <\/ul>)? *$/,"",str) M=split(str,tmp,/<br>/) for(j=1;j<=m;j++) if(tmp[j] ~ /<li>/) h[++n]=tmp[j] return N # function putheader(date,title,n) { printf "<html>\n" printf "<head>\n" printf "<meta http-equiv=\"content-type\"" printf " content=\"text/html; charset=euc-jp\">\n" printf "<title>yahoo News (%s)</title>",title printf "</head>\n" printf "<body>\n" printf "<h2>yahoo News (%s: %s : %d )</h2>\n",title,date,n #printf "<a href=\"%s\" target=\"%s\">(home)</a>\n",url,target printf "<hr>\n" # function putfooter() { print "<hr>" print "</body>" print "</html>" (= TARGET) (= DIV) Yahoo! HTML

9. 14 file1.html,file2.html,... yahoo2.awk awk -f yahoo2.awk file?.html > list.html HTML list.html awk -f yahoo2.awk -v TARGET="another" file?.html > list.html TARGET DIV AWK putheader() charset=euc-jp Unix Yahoo! EUC JP MS Windows EUC JP Shift JIS HTML ( MS IE) 9 AWK Yahoo! HTML 2 [1] AWK (2006) [2] AWK (2006) [3] AWK (2006) [4] AWK HTML (2006) [5] A.V. B.W. P.J. ( ) AWK (2004) ( 1989)

9. 15 [6] D.Dougherty A.Robbins ( ) sed & awk (1997) [7] AWK 256 (1993) [8] HTML (1996) [9] HTML & XHTML & CSS (2002) [10] WWW http://www.tohoho-web.com/www.htm