找出一个字符串的所有anagram
给定一个字符串集合S和一个字符串str。要求设计一个数据结构,能够快速找出集合S里所有的、是str的anagram的字符串。
思路:
首先,要分析什么样的字符串才可以互称为anagram。两个字符串如果是anagram,它们经过排序后得到的两个字符串一定相等。或者,两个字符串如果是anagram,它们包含的字符的频率一定相等。
所以,基于anagram的这两个性质,可以有以下两种数据结构方案。
方案一:
采用Hashmap的数据结构:
private Map<String, List<String>> anagrams = new HashMap<String, List<String>>();对集合S里的每一个字符串s_i,首先按字符排序,得到一个sorted_s_i,把s_i插入到hashmap中sorted_s_i对应的List中去(当然,如果hashmap中还没有sort_s_i,就要创建sort_s_i对应的数据项)。要快速找出集合S里所有的、是str的anagram的字符串,只需对str按字符排序,然后从hashmap里找出对应的List,List的字符串就是待求的所有字符串。
方案二:
伪代码如下:
class Word string word map<char, int> frequency Word(string w) word = w for char in word int count = frequency.get(char) if count == null count = 0 count++ frequency.put(char, count) boolean is_anagram_of(that) return this.frequency == that.frequency