问题就是对一个list中的新闻id进行去重,去重之后要保证顺序不变。
直观方法
最简单的思路就是:
<code><a href="https://www.gaodaima.com/tag/ids" title="查看更多关于ids的文章" target="_blank">ids</a> = [1,2,3,3,4,2,3,4,5,6,1] <a href="https://www.gaodaima.com/tag/news" title="查看更多关于news的文章" target="_blank">news</a>_ids = [] for id in ids: if id not in news_ids: news_ids.append(id) print news_ids<br></code>
www#gaodaima.com来源gao!%daima.com搞$代*!码网搞代码
这样也可行,但是看起来不够爽。
用set
另外一个解决方案就是用set:
<code>ids = [1,4,3,3,4,2,3,4,5,6,1] ids = list(set(ids))<br></code>
这样的结果是没有保持原来的顺序。
按照索引再次排序
最后通过这种方式解决:
<code>ids = [1,4,3,3,4,2,3,4,5,6,1] news_ids = list(set(ids)) news_ids.sort(ids.index)<br></code>
使用itertools.grouby
文章一开始就提到itertools.grouby, 如果不考虑列表顺序的话可用这个:
<code>ids = [1,4,3,3,4,2,3,4,5,6,1] ids.sort() it = itertools.groupby(ids) for k, g in it: print k</code>
用reduce
<code>ids = [1,4,3,3,4,2,3,4,5,6,1] func = lambda x,y:x if y in x else x + [y] educe(func, [[], ] + ids)<br></code>
上面是我在ipython中运行的代码,其中的 lambda x,y:x if y in x else x + [y] 等价于 lambda x,y: y in x and x or x+[y] 。
思路其实就是先把ids变为[[], 1,4,3,……] ,然后在利用reduce的特性。
来源:搞代码网:原文地址:https://www.gaodaima.com