工作地點:?北京?蘇州
在搜索領域,每天處理成百上千億級的網頁數據,商品數據,以及各種結構化的數據。幾乎所有海量數據處理領域的各種挑戰,你都將會遇到。
如何用最少的硬件資源索引最多的網頁、商品,并同時處理用戶每天上億的搜索請求?
如何在同一個系統平臺中,索引成千上萬的不同結構的數據?
如何讓上千臺服務器優雅,協調地為用戶提供高效、精準的搜索服務?
如何在每天都有硬件故障的情況下,保證服務穩定可靠?
工作職責:
1、網頁搜索線上服務架構的設計與開發,優化系統架構,不斷提升系統的靈活性,穩定性,可運維性
2、對現有系統的不足進行分析,找到目前系統的瓶頸,分析和改進搜索的策略,提高系統性能
3、搜索新產品的需求溝通、開發和維護
4、編寫基礎系統,支撐線上系統的升級和維護
5、參與構建基于云計算的千億級別規模的互聯網數據平臺,滿足全網和垂直搜索對互聯網數據的需求
6、參與分布式爬蟲核心系統的研發
崗位要求:
1、五年工作經驗,精通c++/java語言,深入理解OO程序設計思想
2、編程和算法能力強
3、有一定的架構設計能力,有很強的分析、解決問題的能力
4、遇到難題能夠持續保持積極,樂觀的態度,并最終解決問題
5、擁有海量數據處理、搜索引擎開發、垂直搜索經驗者優先
6、在網絡爬蟲,網頁離線處理、分布式計算等領域有深厚技術積累者優先
7、在全網抓取調度,全網數據優化、數據挖掘等領域有深厚技術積累者優先