ป้ายกำกับ

Google (13) forum (12) webboard (12) กระดานสนทนา (12) ethic (10) มารยาท (10) politic (9) การเมือง (9) election (6) life (6) life style (6) local (6) การเลือกตั้ง (6) ชีวิต (6) ท้องถิ่น (6) cartoon (5) history (5) การ์ตูน (5) ประวัติศาสตร์ (5) แบบแผนชีวิต (5) family (4) freetalk (4) manga (4) strategy (4) war (4) ยุทธศาสตร์ (4) สงคราม (4) สนทนาทักทาย (4) data (3) download (3) sun tzu (3) ข้อมูล (3) ครอบครัว (3) ซุนวู (3) ระเบียบวิธี (3) Algorithm (2) administration (2) art (2) book (2) buddhist (2) business (2) chatroom (2) fiction (2) instruction (2) learning (2) management (2) methodology (2) monk (2) philosophy (2) search (2) society (2) technology (2) thai (2) website (2) การเรียนรู้ (2) ค้นหา (2) จัดการ (2) ธุรกิจ (2) นิยาย (2) บริหาร (2) ปรัชญา (2) พระสงฆ์ (2) พุทธศาสนา (2) ภาษาไทย (2) วิธีใช้ (2) สังคม (2) หนังสือ (2) ห้องสนทนา (2) เทคโนโลยี (2) E-mail (1) Facebook (1) Gmail (1) Thailand (1) Twitter (1) Youtube (1) ads (1) artbook (1) artist (1) birthplace (1) blog (1) city (1) communication (1) computer (1) concubine (1) discuss (1) eating (1) fallacy (1) father (1) focus (1) food (1) future (1) growth (1) height (1) homeland (1) ink (1) internet (1) introduce (1) language (1) lie (1) logic (1) marketing (1) morale (1) open (1) paper (1) parents (1) political party (1) printer (1) procedure (1) profile (1) reader (1) scan (1) service (1) spam (1) start (1) studybook (1) sufficient (1) system (1) thanks (1) thin (1) three kingdoms (1) topic (1) traveling (1) uthaithani (1) video (1) weblog (1) webmaster (1) weight (1) กระดาษ (1) กระทู้ (1) การกิน (1) การตลาด (1) การสื่อสาร (1) การเดินทาง (1) การเติบโต (1) ขยะข้อมูล (1) ขอบคุณ (1) ข้อปฏิบัติ (1) คติธรรม (1) ความสูง (1) คอมพิวเตอร์ (1) ตรรกะวิบัติ (1) ตรรกะศาสตร์ (1) ตระกูล (1) ตอแหล (1) นักอ่าน (1) น้ำหนัก (1) บรรพชน (1) บริการ (1) บ้านเกิด (1) บ้านเกิดเมืองนอน (1) ประเทศไทย (1) ผอม (1) พรรคการเมือง (1) พอเพียง (1) พ่อ (1) ภาษา (1) มุมมอง (1) ระบบ (1) วิจารณ์ (1) ศิลปิน (1) ศีลธรรม (1) สามก๊ก (1) หมึก (1) อนาคต (1) อาหาร (1) อุทัยธานี (1) เครื่องพิมพ์ (1) เมียน้อย (1) เมือง (1) แนะนำตัว (1) แบบเรียน (1) โฆษณา (1)

วันอาทิตย์ที่ 6 กุมภาพันธ์ พ.ศ. 2554

วิธีลับในการหาข้อมูลจาก Googleและมันทำงานอย่างไร

วิธีใช้google

1.Google จะใช้ and (และ) อยู่ในประโยคเสมอ เช่น ค้นหา harvest moon back to nature Google จะค้นหาแบบ harvest AND moon AND back... (พูดง่ายๆคือค้นหาแบบแยกคำ) 

2. การใช้ OR (หรือ) คือการให้ Google หาข้อมูลมากขึ้นจาก คำA และ คำB (พูดง่ายๆ คือนำผลที่ได้ มารวมกันรวมกัน) วิธีใช้ พิมพ์ OR ด้วยตัวใหญ่ระหว่างคำที่ต้องการ เช่น vacation london OR paris คือหาทั้งใน London และ Paris 

3. Google จะละคำทั่วๆไป (เช่น the, to, of) และตัวอักษรเดี่ยว เพราะจะทำให้ค้นหาช้าลง แต่ถ้าคำพวกนั้นสามารถช่วยให้หาข้อมูลง่ายขึ้น ก็ต้องใช้เครื่องหมาย + ช่วยโดยนำไปอยู่หน้าคำนั้น (ต้องเว้นวรรคก่อนด้วย) เช่น back +to nature หรือ final fantasy +x 

4. Google สามารถกันขอบเขตการค้นหาให้เล็กลงด้วยการใช้ Advanced Search หรือ การค้นหา แบบพิเศษ ใน Google ภาษาไทย 

5. Google สามารถตัดคำพ้องรูปได้โดยใช้เครื่องหมาย - ช่วยโดยการนำไปอยู่คำที่จะตัด เช่น คำว่า bass มี 2 ความหมายคือ เกี่ยวกับปลา และดนตรีเราจะตัดที่มีความหมายเกี่ยวกับดนตรีออกโดยพิมพ์ bass -music หมายความว่า bass ที่ไม่มีคำว่า music นอกจากนี้มันยังสามารถตัดอย่างอื่นได้อีก เช่น "front mission 3" -filetype:pdf หมายความว่า เรื่องเกี่ยวกับ front mission 3 แต่ไม่แสดงไฟล์ PDF 

6. การค้นหาแบบทั้งวลี (คือการค้นหาทั้งกลุ่มคำ) ให้ใช้เครื่องหมาย " " เช่น "Breath of fire IV" 

7. Google สามารถแปลเว็บภาษา Italian, French, Spanish, German, และ Portuguese เป็น ภาษาอังกฤษได้ (โดยคลิ้กที่คำว่า "Translate this page" ด้านข้างชื่อเว็บ) 

8. Google สามารถหาไฟล์ในรูปแบบอื่นๆที่ไม่ใช่ HTML ได้ ประเภทไฟล์ที่รองรับคือ 

Adobe Portable Document Format (นามสกุลของไฟล์ pdf) 
Adobe PostScript (นามสกุลของไฟล์ ps) 
Lotus 1-2-3 (นามสกุลของไฟล์ wk1, wk2, wk3, wk4, wk5, wki, wks, wku) 
Lotus WordPro (นามสกุลของไฟล์ lwp) 
MacWrite (นามสกุลของไฟล์ mw) 
Microsoft Excel (นามสกุลของไฟล์ xls) 
Microsoft PowerPoint (นามสกุลของไฟล์ ppt) 
Microsoft Word (นามสกุลของไฟล์ doc) 
Microsoft Works (นามสกุลของไฟล์ wks, wps, wdb) 
Microsoft Write (นามสกุลของไฟล์ wri) 
Rich Text Format (นามสกุลของไฟล์ rtf) 
Text (นามสกุลของไฟล์ ans หรือ txt)

วิธีใช้ filetype:นามสกุลของไฟล์ เช่น "Chrono Cross" filetype:pdf หมายความว่าเอกสารของ Chrono Cross ที่เป็น PDF และมันยังมีความสามารถดูไฟล์เหล่านั้นในรูปแบบของ HTML ได้ (โดยคลิ้ก View as HTML หรือ รูปแบบ HTML ใน Google ไทย) 

9. Google สามารถเก็บ Cached ของเว็บที่จะเข้าชมไว้ได้ (โดยคลิ้กที่ Cached หรือ ถูกเก็บไว้ ใน Google ภาษาไทย) ประโยชน์ของมันคือช่วยให้เราสามารถเข้าเว็บบางเว็บที่อาจโดนลบไปแล้ว โดยข้อมูลที่ได้เป็นข้อมูลก่อนถูกลบ (ใหม่สุดที่มันจะมีได้) 

10.Google สามารถค้นหาหน้าที่คล้ายกัน (โดยคลิ้ก Similar pages หรือ หน้าที่คล้ายกัน ใน Google ภาษาไทย) โดยจะค้นหาข้อมูลที่คล้ายๆ กันให้เรา เช่น ถ้าเรากำลังหาข้อมูลการวิจัย ความสามารถนี้จะช่วยให้หาข้อมูลได้มากมายในเวลาที่รวดเร็วโดยไม่ต้องเป็นห่วงเรื่อง keyword 

11.Google สามารถค้นหา link ทั้งหมดที่เชื่อมไปยังเว็บนั้นได้ วิธีใช้ link:ชื่อ URL เช่น link:www.google.com แต่คุณไม่สามารถใช้ความสามารถนี้ร่วมกับการหาแบบอื่นๆ ได้ 

12.Google สามารถค้นหาเว็บที่จำเพาะเจาะจงได้ โดยพิมพ์ คำที่คุณต้องการเจาะจง site:ชื่อ URL เช่น ถ้าคุณต้องการหาเว็บเกี่ยวกับการเข้า (admission) มหาวิทยาลัย Stanford ให้พิมพ์ admission site:www.stanford.edu 

13.ถ้าคุณมีเวลาน้อย (และคิดว่าโชคดี) Google มีบริการการค้นหาด่วน (ชื่อบริการ I'm Feeling Lucky) โดยที่ Google จะนำเว็บที่อยู่ลำดับแรกของการค้นหา ส่งให้คุณเลย (link ไปเว็บนั้นให้เสร็จ) เช่น คุณต้องการค้นหาเว็บมหาวิทยาลัย Stanford อย่างด่วนให้พิมพ์ Stanford แล้วกด I'm Feeling Lucky หรือ ใช่เลย! เจอแน่ๆ ใน Google ไทย 

14.Google สามารถหาแผนที่ของสหรัฐอเมริกาได้โดยพิมพ์ ที่อยู่ ชื่อถนน พร้อมด้วยชื่อรัฐ เช่น 165 University Ave Palo Alto CA Google จะจัดการส่งแผนที่คุณภาพสูงมาให้คุณ 

15.Google สามารถหาเบอร์โทร (เฉพาะอเมริกา) หรือพิมพ์เบอร์โทรแล้วหาบริษัทได้โดยพิมพ์
first name (or first initial), last name, city (state is optional) 
first name (or first initial), last name, state 
first name (or first initial), last name, area code 
first name (or first initial), last name, zip code 
phone number, including area code 
last name, city, state 
last name, zip code
แล้วแต่ว่าคุณจะใช้แบบไหน 

16.Google สามารถค้นหา Catalog สินค้าได้ (เข้าไปที่ http://catalogs.google.com) 

17.Google สามารถเก็บข้อมูลลักษณะการใช้ที่คุณต้องการได้โดยเข้าไปที่ Preferences หรือ ตัวเลือก ใน Google ไทย

สามวิธี ใน Google ที่ให้ได้มาซึ่งทุกอย่าง ที่อยากดาวน์โหลด ในอินเตอร์เน็ต

คำแนะนำ คุณสามารถใช้วิธีนี้ ในการหาดาวน์โหลดโปรแกรม แคร็ก ซีดี คีย์ หรือต่างๆนานา ที่คุณอยากได้ แต่ผมขอแนะนำว่า คุณควรจะดาวน์โหลด มาเพื่อการทดลอง ทดสอบ หรือการศึกษาเท่านั้น หากคุณชอบ ผมก้ออยากให้คุณซื้อโปรแกรมนั้น

วิธีที่หนึ่ง
พิมพ์คำเหล่านี้ ใน Google Search 
(1) 
"parent directory " /appz/ -xxx -html -htm -php -shtml -opendivx -md5 -md5sums 
(2) 
"parent directory " DVDRip -xxx -html -htm -php -shtml -opendivx -md5 -md5sums 
(3) 
"parent directory "Xvid -xxx -html -htm -php -shtml -opendivx -md5 -md5sums 
(4) 
"parent directory " Gamez -xxx -html -htm -php -shtml -opendivx -md5 -md5sums 
(5) 
"parent directory " MP3 -xxx -html -htm -php -shtml -opendivx -md5 -md5sums 
(6) 
"parent directory " Name of Singer or album -xxx -html -htm -php -shtml -opendivx -md5 -md5sums 

หมายเหตุ ให้คุณเปลี่ยน คำที่ตามหลัง parent directory เช่น MP3 Gamez appz DVDRip เป็นสิ่งที่คุณอยากได้ แล้วก้อค้นหา คุณจะพบกับ ความมหัศจรรย์ใน Google 

Sai อิอิ 

วิธีที่สอง
พิมพ์คำต่อไปนี้ใน Google 

?intitle:index.of? mp3 
จากนั้นแค่เพิ่มชื่อ เพลง อัลบั้ม นักร้อง ลงไป เช่น ?intitle:index.of? mp3 myfavoritesongs 

วิธีที่สาม 
พิมพ์คำต่อไปนี้ใน Google 

inurl:micr0s0f filetype:iso 

จากนั้น ก้อเปลี่ยน คำว่า micr0s0f กับคำว่า iso เป็นคำที่คุณต้องการ เช่น inurl:myc0mpany filetype:zip 


ยังไงก้อเอาไปลองดูแล้วกันนะครับ 
จากคุณ Sai http://netguru.freefronthost.com/viewforum.php?f=2

จากเว็ปบล็อกของ http://soi8.bloggang.com

Googleทำงานอย่างไร

อันที่จริง ตั้งหัวข้อแบบนี้ค่อนข้างลำเอียงไปทาง Search Engine ที่ชื่อ Google มากไปหน่อย แต่ทำอย่างไรได้ ในเมื่อในช่วงเวลานี้ ทั้งนักเล่นเนตเก๋ากึ๊ก หรือใหม่กิ๊ก เวลาจะหาอะไรในอินเตอร์เนต ใครๆ ก็นึกถึง Google กันก่อนทั้งนั้น

Search Engine นั้น มีมานานแล้ว ตั้งแต่สมัยที่ internet ยังไม่แพร่หลายอย่างปัจจุบัน ตอนนั้นมันมีชื่ออย่างเป็นทางการในสูติบัตรว่า Gopher และ Archie ต่อมาอีกหลายปี ความนิยมในอินเตอร์เนตก็พุ่งพรวดทะลุบรรไดดีมาน หลังจากนั้นเทคโนโลยีต่างๆ ก็พรั่งพรูกันมาทั่วสารทิศกันอย่างไม่ขาดสาย จนข้อมูลต่างๆ เริ่มมีวันละหลายๆ ล้านเว็บ มันกลายเป็นห้องสมุดที่มีหนังสือดีๆ และขยะจำนวนมหาศาลกองอยู่มากมาย

การจะหาอะไรสักอย่างในนั้นเล่า .. คงต้องหาอาสาสมัครจำนวนพะเรอเกวียนมารื้อมาค้นกันให้ต่อมเหงือทำงาน กว่าจะได้สิ่งที่ต้องการหาสักชิ้น

Search Engine ก็ถือกำเนิดขึ้นอย่างเป็นทางการภายใต้การ inherit จากญาติรุ่นปู่ที่ชื่อ Gopher, Archie ซึ่งการถือกำเนิดขึ้นมานั้น ก็ทำให้เกิดการแข่งขันเสรีทางด้าน Search Engine ขึ้นมา ยี่ห้อก็เริ่มมีมากขึ้น ไม่ว่าจะเป็น Yahoo , Altavista, infoSeek, Lycos และอะไรอีกมากมาย

ทั้งหมดทั้งปวง เหมือนเรียนโรงเรียนเดียวกันมา หรือไม่ก็แอบไปนั่งก๊งเหล้ากันก่อนสร้างระบบ ความคลับคล้ายคลับคลากันก็เกิดขึ้น ถึงจะมีความแต่งต่างกันอยู่เยอะมากในแต่ละยี่ห้อ แต่หลักๆ แล้ว การทำงานเหล่านั้นเหมือนกัน 

นั่นคือ ...

การที่ Search Engine จะหาไฟล์ที่ต้องการจากจำนวนหมื่นล้านล้านล้านไฟล์ที่มีอยู่ จะต้องมี BOT (พ่อแม่ตั้งชื่อว่า Robot แต่เด็กเกเรแถวบ้าน เรียกสั้นๆ ว่า BOT) .. แต่หลังจาก BOT มีพ่อบุญธรรม ก็โดนวินมอเตอร์ไซค์ปากซอยเรียกว่า Spider (ที่แปลว่าแมงมุมนั่นล่ะครับ) 

เจ้า Spider จะต้องทำการไปรื้อไฟล์ทั้งหมดทั้งปวงที่มีอยู่ แล้วก็จำไว้ว่าไฟล์นี้ ที่อยู่ที่นี่ มี "คำ" ไหนบ้างที่จะช่วยเอามาไว้ช่วยในการค้นหาได้ แล้วมันก็จะทำ index ของคำนั้นๆ เอาไว้ (เบื้องลึก เป็นเรื่องราวที่น่าปวดหัวในวิชา data structure ที่ทำไมผมไม่ตั้งใจเรียนแต่แรกนะ ชิ..)



แล้วเจ้าแมงมุมของเรามันเริ่มต้นการเดินทางยังไง ถึงมาค้นหาไฟล์ของลุงทองคำที่สร้างเว็บ OTOP ของหมู่บ้านหนองปลาดุกกันได้เล่า? เจ้าแมงมุมไม่รู้จักหมู่บ้านหนองปลาดุก ไม่รู้จัก OTOP ดังนั้นมันจะเริ่มค้น .... เดี๋ยวๆๆๆ ขอคั่นเวลาแป้บนึงครับ ... กรรมวิธีของเจ้าแมงมุมเนี่ย ไม่ได้ทำตอนที่เราต้องการหาอะไรสักอย่าง แต่มันทำงานอยู่เบื้องหลังอยู่เรื่องๆ โดย Search Engine Server นั้นๆ เป็นผู้สั่งให้กระทำ ...

.. กลับมาเข้าเรื่อง หลังจากที่เจ้าแมงมุมจะเริ่มต้นการเดินทาง มันจะเริ้มต้นจากเว็บที่มีชื่อเสียงก่อน แล้วก็ดู link ในหน้านั้นๆ ว่าไปที่ไหนบ้าง พอเจอแล้ว มันก็กระโดดไปที่ link นั้น แล้วก็ทำอย่างนี้ วนไปวนมา ท่านคิดดูเอาเองละกันครับ เจ้าแมงมุมตัวน้อยนิด จะต้องเหนื่อยขนาดไหน กว่าจะวิ่งมาเจอ OTOP ของหมู่บ้านหนองปลาดุกเนี่ย

แน่นอนว่า เว็บไซต์ต้องมี Dead Link นั่นคือ ไม่ได้ต่อเชื่อมชาวบ้านไปไหน link ไปที่เสียๆ แต่นั่นก็เป็นส่วนน้อยมากๆ ก็ดังคำกล่าวที่ว่า "ถนนทุกสายมุ่งสู่เมืองหลวง" (ผมเคยคิดว่า มันจะจริงเร้อออ แล้วผมก็เดินทางไปยังถนนที่กันดารที่สุด .. ผมดีใจมาก ว่าในที่สุดผมก็เจอถนนที่ไม่มีทางไปแล้ว .. แต่พอผมหันหลังกลับมา ... อ้าว ผมเดินทางมาตามถนนจากเมืองหลวงนี่หว่า!!)

เมื่อได้ link เหล่านั้น ก็จะทำการเก็บข้อมูลเอาไว้ว่า

ใน HTML นั้น มีคำอะไรอยู่บ้าง

คำนั้น มันอยู่ที่ไหนใน HTML นั้น

(จริงๆ หลักการพวกนี้คือ META Tag ซึ่งอยู่ที่ Header ของ HTML แต่ Google ใจป้ำ ทำตัวเป็นเสี่ย .. เล่นรื้อทั้ง HTML เลย)

Google นั้นทำงานโดยใช้แมงมุม 3 ตัวต่อหนึ่งครั้ง ซึ่งแต่ละตัวจะมีถึง 300 connections เพื่อเปิดเว็บต่อหนึ่งครั้ง แต่ในช่วงเวลาที่ peak แล้วนั้น จะใช้แมงมุมถึง 4 ตัว ทำให้เปิดเว็บได้ถึง 100 หน้า ต่อ 1 วินาที .. โอว ป้ามาธาร์ เป็นไปได้ยังไงเนี่ย

หลังจากหาสิ่งต่างๆ คัดแยกออกมาเรียบร้อยแล้ว ก็เป็นเวลาของการทำ index กันล่ะ .. แต่ก่อนอื่น ผมขอถามอะไรนิดนึงครับ เคยเดินไปเลือกซื้อเทปหรือ CD เพลงหรือ .. อะไรก็ช่างเหอะ .. สักอย่างหนึ่ง ซึ่งมีของประเภทเดียวกันอยู่เยอะเลย แต่ท่านมั่นใจว่า .. อันนี้แหละ มันเกิดมาเพื่อเรา ... กันไหมครับ?

นั่นคือสิ่งที่ index ทำเพิ่มขึ้นมา นั่นคือการ weight น้ำหนักให้กับคำต่างๆ ที่มันค้นพบ เพื่อเพิ่มความง่ายต่อการค้นหายังไงล่ะครับ เหมือนเดินไปที่ร้านเทป "พี่ ตอนนี้อะไรดัง ขอสักม้วนสิ" พี่เค้าก็หยิบมาให้อย่างเร็วไว "รำเต้ยสมหมายน้อย" เป็นต้น

ทำไมพี่เค้าถึงหยิบมาได้ไวล่ะครับ ก็พี่เค้ามีระบบการจัดการในร้านของเค้าเหมือนกับที่ Search Engine ทำยังไงล่ะครับ จัดหมวดหมู่มัน แล้วจัดตามตัวอักษร อันไหนใหม่หน่อยก็เอามาวางหน้าร้าน อันไหนฮิตหน่อยก็วางเยอะหน่อย และวางใกล้มือคนขายด้วย เผื่อใครตกยุคแบบผมไปถาม เค้าจะได้หยิบได้ถูก

เรื่องราวคร่าวๆ มันก็เป็นขนานนี้ล่ะครับ ถ้าจะให้ลึก ผมแนะนำให้ไปสอบปริญญาโท สาขาทางด้าน IT คาดว่าน่าจะมีสอน เพราะเห็นเพื่อนๆ น้องๆ ใช้เบอร์กามอดกันแทบทุกคนแล้ว

Google Bombing

คือการอาศัยช่องโหว่ของอัลกอริธึ่มในการจัดเรียงอันดับเว็บเพจของ Google ทำให้เว็บเพจที่เราต้องการขึ้นอันดับดี(หรืออันดับหนึ่ง)ใน Google ได้ด้วยคำคีย์เวิร์ดที่ต้องการทั้งๆ ที่ หน้านั้นอาจไม่มีเนื้อหาที่เกี่ยวข้องกับคำคีย์เวิร์ดนั้นเลยก็ได้

วิธีการทำนั้น กล่าวอย่างง่ายคือ ต้องมีลิ้งค์จากเว็บเพจอื่นมายังเว็บเพจที่ต้องการให้ขึ้นอันดับนั้นเป็นจำนวนมากพอสมควร และที่สำคัญมากคือ Link Text นั้นต้องเป็นคำคีย์เวิร์ดนั้นด้วย

ตัวอย่าง Google Bomb อันระบือลือลั่น
คีย์คำต่อไปนี้ลงใน search box ของ Google แล้วคลิกที่ I'm feeling lucky!หรือ ดีใจจัง ค้นแล้วเจอเลย ดู 

miserable failure
worst president
miserable
failure
unelectable

จากบล็อกของคุณกึ่งยิงกึ่งผ่าน
http://over.bloggang.comบล็อกของคุณmeng-kub
http://meng-kub.bloggang.comและบล็อกของคุณvee vee'ครับ
http://rainorshine.bloggang.com

ไม่มีความคิดเห็น:

แสดงความคิดเห็น