第1724章 “考察” (1 / 2)
请看小说网www.qingkanxs.com
“里面比较乱,别嫌弃。”
“哪能呢,你都开公司当老板了。”
跟着王铮推门而入,眼前的景象与他预想中初创公司的大致吻合,只是更显拥挤和务实,更准确地说,是一种被精心控制在成本线之上的、高效而务实的拥挤。
约莫一百五十平的开间,被矮屏风隔成几个区域。
裸露的混凝土天花板下,管线纵横,但布置了合理的照明,光线充足而不刺眼。
十几张办公桌挤在一起,屏幕上闪烁着各色代码和图表。
人员构成显出一种跨国团队的典型面貌。六七张亚洲面孔,男女都有,正对着双屏显示器敲击键盘,偶尔用中文低声交流技术细节。四五个白人,穿着更随意的T恤或格子衫,有的戴着硕大的耳机沉浸在自己的世界里,有的则在白板前激烈地争论着什么,笔迹潦草写满了算法结构。
角落里堆着几台打开的服务器机箱,线缆如藤蔓般缠绕。一旁的休息区,一张旧沙发前的小桌上,散落着吃剩的外卖披萨盒和能量饮料罐。
墙壁上钉着几张伦敦地铁图、写满待办事项的便利贴,以及一张用马克笔醒目写着“KEEP CALM AND DEBUG”的A3纸。
整体氛围忙碌但专注,是一种埋头干活、解决问题的务实劲儿,而非刻意营造的“硅谷式”的那种忙碌的“颓废”,透着一种萌发的欣欣向荣。
“这边是我们的开发部门,那边的是后台部门,其实也就两个人,一个管财务,一个除了财务什么都管......”
王铮引着李乐穿过工位间的狭窄过道,走向最里面用玻璃隔出的一间小屋。
这间所谓的办公室不过七八平米,陈设极其简单,一张老旧的木质办公桌,边角已有些掉漆,上面放着两台显示器、一台笔记本电脑和一堆技术文档。
两把看起来是从二手市场淘来的转椅,一个简易书架塞满了技术手册和行业报告,墙角堆着几箱未拆封的电子配件或宣传材料。
窗户不大,望出去是相邻建筑的砖墙,视野局促。
“你这办公室,挺……朴素的。”李乐环视一周,实话实说。
王铮笑了笑,随手拂过桌面,“创业初期,钱得花在刀刃上。服务器、带宽、人员工资,哪样不比老板的排场要紧?我现在要是弄个落地窗大办公室,摆上红木茶桌和茶具、大展宏图银龙鱼,那才是心里发虚,骗投资人骗自己呢。”
他给李乐拉了把椅子,“我反正观察过,以后你要是看到那种七八个、十来个人的初创公司,老板先给自己搞个气派非凡的独立空间的,这种,基本上撑不过几年就得完蛋。心思没全放在产品和市场上。踏实干活的人,没人在意这个。”
李乐深以为然地点点头,“是这个理儿。”
“喝点什么?水?咖啡?不过咖啡得去外面抢,那帮小子消耗得快。”王铮问道。
“水就行,咖啡对我没用。”
“咱俩差不多,咖啡抵抗,对了,怎么有空来我这儿了?”王铮从角落的小纸箱子里抠出两瓶矿泉水,递了一瓶给李乐,
李乐接过来,笑道,“今天过来,其实是心里一直惦记着个事儿。上回听你聊那个金融数据分析平台的构想,觉得思路挺启发人。我回去也琢磨了琢磨,正好今天在附近,记着你说过你公司就在这儿,就冒昧过来看看,顺便想请教几个问题,没打扰你们吧?”
“哪儿的话,我们这儿平时也有朋友、潜在客户过来聊,没那么封闭。怎么,李博士是对金融科技这块感兴趣了?”王铮语气半开玩笑。
“那倒不是,”李乐拧开瓶盖喝了一口,“是我自己研究上遇到点麻烦,想着你们是专业做这个的,或许能有思路。”
“思路,你的研究?”王铮一愣,随即想道,“哦,对,你是社会学,是不是数据统计?你们不是常用SPSS么?”
“是,”李乐点点头,又给解释着,“不过我的方向是网络社会学研究,经常需要从各大网站、论坛、新闻门户抓取大量文本数据,比如特定话题的讨论帖、新闻评论、博文什么的,用来做内容分析和趋势研究。”
“但现在常用的几个爬虫工具,要么功能太简单,只能抓取静态页面,遇到复杂点的JS渲染或者需要登录交互的就抓瞎。”
“要么配置起来极其复杂,得写一堆规则,维护起来特别麻烦,动不动就因为网站改版失效了,效率很低,而且很多深层数据、关联数据根本拿不到。”
王铮听得很认真,“嗯,通用爬虫确实有这些问题。它们追求的是广度,但对特定领域的深度挖掘和结构化处理,就很弱。”
“而,你的需求是需要那种.....能精准锁定目标,并且能理解页面内容结构的工具,对吧?”
“诶,对对对,就是这个意思,”李乐一拍手,把凳子往前拉了拉,比划道,“最好能智能识别出不同网站的文章主体、评论区块、作者、发布时间这些元数据,自动把它们结构化地提取出来,存成规范的格式,比如JSON或者直接入数据库。而不是一堆杂乱的HTML代码,还需要我后期花大量人力去清洗和标注。”
本小章还未完,请点击下一页继续阅读后面精彩内容!
听了李乐的意思,王铮沉吟片刻,眼神中流露出技术人遇到具体问题时的专注,“技术上完全可行。这属于聚焦爬虫或垂直领域爬虫的范畴,核心是定制化规则和智能解析。”
-->>(本章未完,请点击下一页继续阅读)