ป้ายกำกับ

Google (13) forum (12) webboard (12) กระดานสนทนา (12) ethic (10) มารยาท (10) politic (9) การเมือง (9) election (6) life (6) life style (6) local (6) การเลือกตั้ง (6) ชีวิต (6) ท้องถิ่น (6) cartoon (5) history (5) การ์ตูน (5) ประวัติศาสตร์ (5) แบบแผนชีวิต (5) family (4) freetalk (4) manga (4) strategy (4) war (4) ยุทธศาสตร์ (4) สงคราม (4) สนทนาทักทาย (4) data (3) download (3) sun tzu (3) ข้อมูล (3) ครอบครัว (3) ซุนวู (3) ระเบียบวิธี (3) Algorithm (2) administration (2) art (2) book (2) buddhist (2) business (2) chatroom (2) fiction (2) instruction (2) learning (2) management (2) methodology (2) monk (2) philosophy (2) search (2) society (2) technology (2) thai (2) website (2) การเรียนรู้ (2) ค้นหา (2) จัดการ (2) ธุรกิจ (2) นิยาย (2) บริหาร (2) ปรัชญา (2) พระสงฆ์ (2) พุทธศาสนา (2) ภาษาไทย (2) วิธีใช้ (2) สังคม (2) หนังสือ (2) ห้องสนทนา (2) เทคโนโลยี (2) E-mail (1) Facebook (1) Gmail (1) Thailand (1) Twitter (1) Youtube (1) ads (1) artbook (1) artist (1) birthplace (1) blog (1) city (1) communication (1) computer (1) concubine (1) discuss (1) eating (1) fallacy (1) father (1) focus (1) food (1) future (1) growth (1) height (1) homeland (1) ink (1) internet (1) introduce (1) language (1) lie (1) logic (1) marketing (1) morale (1) open (1) paper (1) parents (1) political party (1) printer (1) procedure (1) profile (1) reader (1) scan (1) service (1) spam (1) start (1) studybook (1) sufficient (1) system (1) thanks (1) thin (1) three kingdoms (1) topic (1) traveling (1) uthaithani (1) video (1) weblog (1) webmaster (1) weight (1) กระดาษ (1) กระทู้ (1) การกิน (1) การตลาด (1) การสื่อสาร (1) การเดินทาง (1) การเติบโต (1) ขยะข้อมูล (1) ขอบคุณ (1) ข้อปฏิบัติ (1) คติธรรม (1) ความสูง (1) คอมพิวเตอร์ (1) ตรรกะวิบัติ (1) ตรรกะศาสตร์ (1) ตระกูล (1) ตอแหล (1) นักอ่าน (1) น้ำหนัก (1) บรรพชน (1) บริการ (1) บ้านเกิด (1) บ้านเกิดเมืองนอน (1) ประเทศไทย (1) ผอม (1) พรรคการเมือง (1) พอเพียง (1) พ่อ (1) ภาษา (1) มุมมอง (1) ระบบ (1) วิจารณ์ (1) ศิลปิน (1) ศีลธรรม (1) สามก๊ก (1) หมึก (1) อนาคต (1) อาหาร (1) อุทัยธานี (1) เครื่องพิมพ์ (1) เมียน้อย (1) เมือง (1) แนะนำตัว (1) แบบเรียน (1) โฆษณา (1)

วันอาทิตย์ที่ 6 กุมภาพันธ์ พ.ศ. 2554

Page Rank Algorithm : Google มีสิ่งที่รายอื่นไม่มี

Robots มีความสามารถในการรวบรวมข้อมูลได้มากมายมหาศาล แต่จากข้อมูลที่รวบรวม มาทั้งหมดสามารถนำไปใช้ประโยชน์ได้เพียงเล็ก น้อยเท่านั้น ดังนั้นจึงต้องมีการหาวิธีลดขยะที่ไม่จำเป็นออกไป โดยเสิร์ชเอนจินทั่วไปสามารถ แยกข้อมูลที่ไม่มีประโยชน์ออกไปได้กว่า 95% โดยใช้ IndexerŽ โดยเทคนิคที่ใช้คือ การลบสัญลักษณ์พิเศษ คำพหูพจน์และคำเชื่อมออก ไป รวมไปถึงรายการจากหน้าเว็บไซต์ข้อมูล เกี่ยวกับสแปมอีกด้วย ส่วนที่เหลือจึงมีเพียงคำ ที่คุณต้องการและลิงก์ซึ่งจะถูกเก็บไว้รวมกับชื่อ เว็บไซต์และนำเข้าไปไว้ในฐานข้อมูลแล้วแสดง ออกมาในเป็นรายการของ Internet Search Engine
เสิร์ชเอนจินทุกตัว เช่น Alltheweb, Alta-vista หรือ Google ต่างก็มีหลักการทำงานดังที่กล่าวมานี้คล้ายๆ กัน สิ่งที่ต่างกันอยู่ที่การนำผลการค้นหาที่ได้มาแสดงเป็นรายการให้คุณเห็น ซึ่งตรงจุดนี้เป็นความลับที่ทำให้ Google ประสบความสำเร็จได้ดังที่เห็น นั่นคือวิธีการจัดลำดับความสำคัญของหน้าอินเทอร์เน็ต โดยความคิดนี้เริ่มต้นขึ้นเมื่อประมาณ 6 ปีที่แล้ว โดยนักศึกษาภาควิทยาศาสตร์คอมพิวเตอร์จากมหาวิทยาลัย Stanford ในแคลิฟอร์เนีย 2 คน ที่ชื่อว่า Sergey Brin และ Lawrance Page เกิดความคิดที่จะสร้าง Search Engine ที่ใช้หลักการทำงาน โดยการแยกหน้าอินเทอร์เน็ตที่มีความสำคัญและไม่มีความสำคัญออกจากกัน และเรียกระบบ ดังกล่าวว่า Google ซึ่งมาจากคำว่า Googol ที่แสดงถึงเลข 10100 ซึ่งการค้นหาของเสิร์ชเอนจิน ดังกล่าวจะใช้ค่าที่แสดงถึงคุณภาพมาตรฐานของหน้าเว็บไซต์แต่ละหน้า จึงได้มีการตั้งค่าลำดับความสำคัญหรือ Page Rank ขึ้นมา และสร้างวิธีการที่สามารถคำนวณหาค่าความสำคัญ ของหน้าเว็บไซต์ต่างๆ ได้ ซึ่งรายละเอียดเกี่ยวกับสมการที่ใช้ในการคำนวณหาค่า Page Rank นี้รวมถึงที่มาและวิธีการคิด มีอธิบายไว้ในหน้าเว็บไซต์ http://www.db.stanford.edu/pub/papers/google.pdf
หลังจากที่ได้เริ่มมีการใช้ PageRank นี้ทำให้ เกิดการเปลี่ยนแปลงครั้งใหญ่ในระบบอินเทอร์เน็ต สมการที่ใช้ในการคิดคำนวณหาค่า Page Rank ได้ถูกพัฒนาขึ้น อย่างไรก็ตามข้อมูลอื่นนอกเหนือไปจากนี้ไม่ได้รับการเปิดเผยออกมาอีกความลับทุกอย่างเกี่ยวกับหัวใจของการทำงานของ Google ไม่ได้รับการแพร่งพราย เหมือนกับที่บริษัท Coca Cola ไม่ยอมเปิดเผยสูตรน้ำอัดลม ออกมาให้บริษัทอื่นได้รับรู้
นอกจากนี้ส่วนสำคัญอีกส่วนหนึ่งที่เป็นเสมือนตัวกลางในการทำงานของ Google ได้แก่ การอัพเดต Google Index ประจำเดือนที่เรียกกันว่า Google-DanceŽ ซึ่งชื่อดังกล่าวมาจากในยุคหนึ่งที่หน้าเว็บไซต์ของ Google จะเกิดปัญหาขึ้นในช่วงของการอัพเดตหน้า Index ซึ่งเป็นผล ให้ผู้ใช้เกิดความสับสนเป็นเวลาหลายชั่วโมง อันดับของรายการที่ค้นพบมีการเปลี่ยนแปลงสลับกัน หรือผลการค้นหาที่ได้แตกต่างกันโดย สิ้นเชิงทั้งๆ ที่ใช้เวลาในการค้นหาต่างกันเพียง แค่ไม่กี่วินาที เหมือนกับว่าข้อมูลแต่ละตัวมีขาเต้นไปได้เรื่อยๆ ไม่อยู่กับที่
สาเหตุของความยุ่งเหยิงวุ่นวายนี้สามารถอธิบายได้ง่ายๆ คือ Google มีศูนย์กลางการควบคุมอยู่ทั้งหมด 10 แห่ง โดยแต่ละแห่งมี Index ที่ใช้ประจำที่อยู่ เมื่อ Google ทำการค้นหาใดๆ ก็จะถูกแบ่งไปยังศูนย์กลางแต่ละแห่งตามแต่ความหนาแน่นของผู้ใช้ ดังนั้นจึงเป็นไปได้ว่าการค้นหาข้อมูลในระยะเวลาที่ห่างกันไม่ถึงนาที จะเกิดจากการทำงานของเซิร์ฟเวอร์คนละตัว ในช่วงเวลาของการอัพเดตข้อมูลของ Index ใหม่ที่จะถูกเปลี่ยนแปลงลงในเซิร์ฟเวอร์แต่ละตัวจะเกิดไม่พร้อมกัน จึงเป็นผลให้เกิดคามแตกต่างอย่างรุนแรงของรายการที่ค้นพบช่วงระยะเวลาหนึ่ง นั่นคือ Index "dance"
ในหน้าเว็บไซต์ http://googledance.seochat .com มีเครื่องมือที่สามารถแสดงผลการค้นหาจากเซิร์ฟเวอร์แต่ละตัวของ Google ได้ ซึ่งในช่วง Google-DanceŽ โปรแกรมดังกล่าวจะแสดงให้เห็นว่ารายการที่ค้นพบของเซิร์ฟเวอร์แต่ละตัวแตกต่างกัน สำหรับผู้ที่อยากทดสอบการใช้งานเซิร์ฟเวอร์แต่ละตัวโดยเฉพาะก็สามารถเลือกเซิร์ฟเวอร์ที่ต้องการได้ด้วยตัวเอง โดยคุณต้องป้อนชื่อเรียกให้ถูกต้อง เช่น http://www.fi.google.com หรือ http://www.va.google.com เป็นต้น

ขอบคุณข้อมูลจาก chipthailand.com

ไม่มีความคิดเห็น:

แสดงความคิดเห็น