微薄短域名原理及作用
最近呀。微薄在国内火的的”一塌糊涂“。作为技术人员对其中的短域名比较感兴趣,很好奇这么做的原因,及实现这个的原理!希望知道的进来讨论一下哈!
?
例如:http://url.cn/1zJdGX? 解析以后是 http://bjwb.bjd.com.cn/html/2011-03/23/content_382746.htm
?
?
补充:
?
经过讨论这么做的好处大致:
?
1.广告效益,方便记忆!!
?
2.方便做统计和挖掘。每一次点击和引用服务提供方都有记录和跟踪。
?
3.可能也是为了避免同样的链接被大量用户引用,缩短链接长度以便节省存储空间,微薄的用户关注的都是一些热点话题,用户发的不同微薄中出现同样的链接是比较常见的。
4.存储到数据库可能是纯文本???待讨论!
?
?
实现原理:
?
基本是上通过key,value的方式进行存储。但是最终存储在nosql,还是关系数据库,需要进一步讨论》》》
?
大家继续给力哈!!
?
?
) * 1) & 0x3fffffff;$base62_unit6 = '';
while ($base2_unit30 > 0) {
$base62_unit6 .= $base62_units[$base2_unit30 & 61];
$base2_unit30 >>= 5;
}
return $base62_unit6;
}
for ($i = 0; $i < 100; $i++) {
echo shorten($i) . '<br />';
}
生成的短地址做 key,原地址做 value,存到一个 kv 数据库里。
恩恩。具体的算法就不想在讨论啦。怎么弄的可以。我相信sina和腾讯的算法也不一定一样!
关键是总体思路。 key,value这样方式是肯定的。但是最终落地是不是数据库就两说啦。
有可能是nosql 的实现。还有就是缓存!
另外我还比较关注。短域名的好处!!大家提了一些。大家继续补充。。。。。过几天我整理汇总哟!!!
应该不仅仅是140限制,可能也是为了避免同样的链接被大量用户引用,缩短链接长度以便节省存储空间,微薄的用户关注的都是一些热点话题,用户发的不同微薄中出现同样的链接是比较常见的。
引入短域名原因就是因为微博字数限制,微博都是纯文本的,不方便加入HTML代码。
你这个存储起来需要更大的空间。连接太长啦。
我提到的这块东西。估计会更复杂。在存储里不会存html标签。例如A标签!
我知道,我是回答上面: 之所以弄短域名并不是只是因为 (微薄140限制,如果没限制,谁那么无聊搞个映射?)
你这个存储起来需要更大的空间。连接太长啦。
我提到的这块东西。估计会更复杂。在存储里不会存html标签。例如A标签!
我知道,我是回答上面: 之所以弄短域名并不是只是因为 (微薄140限制,如果没限制,谁那么无聊搞个映射?)
从客户的角度来看,主要是为了品牌效应。
所有的微博的地址都是 t.cn 开始的域名,这是多么大的广告效应?
t.cn 推广开了以后,会成为微博的代名词。 38 楼 lovebanyi 2011-04-02 省空间肯定是不可能的, 因为哪个短网址明显不是压缩算法。而是一种映射,这样的话就必然要求它要同时存储哪个长的地址。
39 楼 yujiaao 2011-04-02 便于手机输入和转发。 40 楼 kk15378924 2011-04-02 我就不理解了。。你们怎么推测出的是62位换算。。。实际经过试验,是64位。最后两位分别是[和].各位可以试试sina的短连接,运气好的直接改一个字符为[或者]都可以跳转 41 楼 kongshanxuelin 2011-04-04 非常简单,见我一个Demo:http://u.faqee.com/addURL.jsp,文章地址:http://cxlh.iteye.com/blog/676985 42 楼 xzq2002 2011-04-05 httpclient_bd 写道研究过类似的一个高效的实现,当然思路非我原创,也是网上前辈们的经验
实现方式是nginx+tt+tc做转发
具体原理是nginx代理到tt的服务端口
稍微修改一下tt的源码,将tt的http协议返回的东西稍作修改, 原来返回value的地方修改为返回302的http报文,把tc里拿到的value作为location回送给浏览器,重新编译后启动TT,直接访问即可。
TC里KEY为短地址,VALUE为URL
url要有长期性,memcached的特性不适合干这事。
tc=tokyo cabinet
tt=Tokyo Tyrant
LZ有兴趣可以研究一下
这个不错,能够减少中间获取实际地址这一操作
apache不知道能实现不 43 楼 yizhilong28 2011-04-06 微薄 or 微博? 44 楼 xiaojiankaka 2011-04-06 为啥我总觉得这个“薄”字看着怪怪的~ 45 楼 猫尾摆摆 2011-04-07 方便记忆纯属乱编,无非是微博前期140个字的限制而已。。。。。。。 46 楼 lj30936 2011-04-11 对程序员来说,错别字就像语法级的bug,写的时候尽量注意点,不是‘薄’,是‘勃’。。。